A Huawei nemrégiben egy újabb processzort készített, amivel az adatközpontok szegmensét veszik célba, a friss modell pedig nem más, mint a KunPeng 930. Az ARM architektúra köré épülő processzormagokból maximum 80 darab kaphat helyet a 77,5 milliméter hosszú és 58 milliméter széles tokozáson belül, ami több chipletet is tartalmaz: a CPU magokat tartalmazó csempéket állítólag a TSMC N5 gyártástechnológiájával készítették, míg az I/O részleget kiszolgáló lapka az SMIC műhelyében készült, valószínűleg egy régebbi gyártástechnológiával, talán a 14 nm-es osztályúval.
Alapvetően meglepő, hogy a Huawei hozzáfér a TSMC 5 nm-es osztályú gyártástechnológiájához, de abból kiindulva, hogy korábban az Ascend sorozatú AI gyorsítókat is sikerült legyártatnia a kínai vállalatnak a TSMC-vel, méghozzá úgy, hogy közvetítő cégeken keresztül adta le a rendeléseket, az aktuális helyzet nem példa nélküli.
A hibrid felépítés révén a Huawei jobban el tudja osztani a lapkák gyártását, hatékonyabban ki tudja aknázni az egyes partnerek erősségeit, valamint arról is tud gondoskodni, hogy azok a komponensek, amelyek képesek profitálni a fejlettebb csíkszélesség nyújtotta előnyökből, egy modernebb gyártástechnológiával készüljenek; míg azok, amelyeknél nem kritikus fontosságú a fejlett csíkszélesség alkalmazása, egy szélesebb körben, nagyobb mennyiségben is elérhető gyártástechnológiára támaszkodhatnak, amit akár a kínai SMIC is biztosíthat.
Az új processzor esetében a Compute Tile összesen maximum 40 darab ARM alapú processzormagot tartalmaz, vagyis a címben említett 80 processzormag eléréséhez két darab ilyen CPU Tile alkalmazására van szükség. Ezekhez kapcsolódik az I/O lapka, ami számos I/O komponenssel rendelkezik, például tartalmaz egy 96 PCIe sávval rendelkező PCI Express hubot, illetve számos egyéb összetevőt is.
A szóban forgó processzort egy Kurnal becenevet használó tartalomgyártó elemezte a Bilibili és a YouTube virtuális hasábjain keresztül, így sok-sok érdekességre derült fény. Például arra, hogy processzormagonként egy pár 2 MB-os L2 Cache áll rendelkezésre, valamint nagyjából 91 MB-nyi megosztott harmadszintű gyorsítótárhoz is hozzáférnek a processzormagok, amelyek egy CPU Tile fedélzetén foglalnak helyet. Ezek alapján kiemelten fontos volt, hogy masszív gyorsítótárral dolgozhasson a rendszer, de a jelek szerint a memória-alrendszert sem aprózták el. A diagramok alapján egy-egy CPU Tile fedélzetén nem kevesebb, mint 12 darab DDR5-ös memóriacsatornát kezelő memóriavezérlők találhatóak, vagyis a kétlapkás chip összesen maximum 24 darab DDR5-ös memóriacsatornát foghat munkára.
A kiszivárgott platform-alaplap fotója alapján nem használják az összes memóriacsatornát, processzoronként a jelek szerint csak 16 memóriacsatorna, pontosabban 16 memóriafoglalat áll rendelkezésre, ami arra utalhat, hogy az extra memóriavezérlők a kihozatali arány javításában segítenek. A PCI Express sávok közül sem használják mind a 96-ot, a platform alaplapja csak nagyjából 80 sávot foghat munkára, ami mögött megint csak a kihozatali arány javítása állhat, valamint az, hogy költséghatékonysági szempontokat is figyelembe vettek – a kevesebb PCIe sáv alkalmazása egyszerűbb dizájnt eredményez.
Arról egyelőre nincs hír, hogy a speciális hibrid processzor pontosan hogyan teljesít élesben, de remélhetőleg erre is rövidesen fény derülhet.