A Kínai Tudományos Akadémia Számítástechnikai Intézetének kutatói egy meglehetősen érdekes fejlesztésről számoltak be: elkészítettek egy 256 processzormagot tartalmazó, több chipletből álló processzort, ami alapján később akár 1600 processzormaggal rendelkező, szilícium-ostya méretű chipet is létrehozhatnak. Hasonlón az amerikai Cerebras is dolgozik, amelynek szakemberei 2021 folyamán egy 850 000 processzormagból és 2,6 billió tranzisztorból álló monstrumot hoztak létre, méghozzá 7 nm-es csíkszélesség alkalmazásával, 15 kW-os fogyasztással.
A kínai fejlesztés nem ennyire impresszív, ott ugyanis jelenleg „csak” egy 256 processzormaggal rendelkező, több chipletből álló megoldás készült, ám a későbbiekben szilícium-ostya méretű chip létrehozására is lehetőség nyílhat. Az aktuális lapka a Zhejiang Big Chip nevet viseli, a 256 processzormagot pedig összesen 16 chiplet biztosítja, amelyek egyenként 16 darab RISC-V alapú processzornak adnak helyet. Minden egyes chiplet tud kommunikálni a szomszédos chipletekkel a 2,5D összekötőn keresztül, maga a dizájn pedig a hagyományos szimmetrikus multiprocesszor felépítést követi, ahol a chipletek között a chipen kialakított hálózat teremt kapcsolatot, így ezek a rendelkezésre álló memóriát is meg tudják osztani egymással. A chiplet alapú dizájn a kutatók szerint remekül skálázódhat, ennek hatására akár 100 chipletből álló chip is készülhet a nem is oly távoli jövőben, ami a 16 maggal ellátott chipletekkel számolva 1600 mag jelenlétét eredményezi.
A chipletek nem a legmodernebb gyártástechnológiával készültek, ugyanis 22 nm-es csíkszélességet alkalmaztak hozzájuk, gyártásukat pedig valószínűleg az SMIC (Semiconductor Manufacturing International Corporation) végezte. Az 1600 magos chip jóvoltából a jövőben jelentősen javítani lehet majd a fogyasztást és a teljesítményt, hála a csökkentett késleltetésnek, ami a dizájn sajátosságaiból fakad. Ezeket a chipeket később az adatközpontok és a szuperszámítógép-fürtök szegmensében is fel lehet majd használni, ahol ExaFLOP/s szintű teljesítmény elérésére is lehetőség nyílhat.
A leírás szerint az új, chiplet alapú felépítéssel rendelkező Zhejiang Big Chip esetében három szintből álló memória-hierarchia van érvényben, ami a magokhoz kapcsolódó gyorsítótárakból, a chipleten kialakított memóriából, illetve a chipleten kívüli memóriából tevődik össze. Az egyes memóriaszintek egymástól eltérő fogyasztás, sávszélesség és késleltetés mellett üzemelhetnek, valamint bekerülési költségek terén is elég nagy a szórás. A dizájn értelmében több mag osztozik egy gyorsítótáron, amelyek Cross Switch rendszerben kapcsolódnak egymáshoz. Ezek a csoportok a chipen belüli hálózaton keresztül kommunikálhatnak egymással, míg a chipletek közötti hálózat segítségével a chipleten kívüli memóriához is hozzáférnek. A rendszer működésénél és a felépítés megtervezésénél szem előtt kellett tartani, hogy a fenti dizájnban rejlő lehetőségek maximálisan kiaknázhatóak legyenek, így a rendszer hatékonyan működjön. A terhelés-elosztás ugyancsak kritikus szempont, csak úgy, ahogy a rendelkezésre álló memória-sávszélesség hatékony igénybe vétele. Amennyiben minden optimálisan működik, az egyes chipletek hatékonyan együttműködve dolgozhatnak a megosztott memóriaterületek igénybe vétele mellett.
Az új chip egyebek mellett a 3D memória-technológiából, illetve számos egyéb modern fejlesztésből is profitálhat, ám a kutatók azt nem részletezték, ezek pontosan hogyan illeszkednek majd az aktuális dizájnba.
A Next Platform szakemberei szerint a kínaiak már el is készítették a 256 magból álló, Zheijang Big Chip névre keresztelt lapkát, így a jövőben feltérképezhetik, hogyan teljesít a rendszer, valamint újításokat is bevezethetnek, amelyek keretén belül változhat a felépítés, a rendelkezésre álló chipletek száma, illetve többféle memóriatípussal is kísérletezhetnek majd. A folyamat vége felé haladva akár a szilícium-ostya méretű chipek gyártása is megkezdődhet, természetesen ugyancsak chiplet alapon.