Az Nvidia a Hot Chips 2025 alkalmával árulta el, pontosan milyen felépítéssel rendelkezik a GB10 SuperChip, amit a MediaTek szakembereivel együttműködve fejlesztettek ki. Az új központi egységgel a vállalat lényegében az adatközpontokra jellemző számítási teljesítményt és képességeket tett elérhetővé az asztali munkaállomások felhasználói számára, ezzel új lehetőséget teremtve a fejlesztői és felhasználói közösségeknek.
A speciális lapka egy több chipletet tartalmazó tokozás formájában érkezik, amelynek egyik komponense egy ARM alapú, a MediaTek által kifejlesztett processzor-részleg, míg a másik egy speciális GPU, ami viszont az Nvidia háza tájáról érkezett és a Blackwell architektúrára támaszkodik. A chip fedélzetén található lapkák a TSMC 3 nm-es csíkszélességével készültek és 2,5D tokozásban kaptak helyet, azaz kifejezetten modern dizájnról van szó.
A CPU részleg összesen 20 darab ARM v9.2 alapú processzormagot vonultathat fel, ezeket két darab tízmagos fürtbe rendezték, amelyekhez fürtönként 16 MB-nyi megosztott harmadszintű gyorsítótár tartozik, az egyes processzormagok pedig saját dedikált másodszintű gyorsítótárat is használhatnak. Az összesen 32 MB-nyi megosztott harmadszintű gyorsítótárral felvértezett chip egy 256-bites memória-adatsínt alkalmaz, ami nemcsak a CPU-, hanem a GPU-részleget is kiszolgálja, méghozzá LPDDR5X-9400 MT/s sebességű memóriachipekkel, amelyekből maximum 128 GB-nyi állhat rendelkezésre, az effektív memória-sávszélesség értéke pedig 300 GB/s környékén helyezkedik el. A nagysebességű I/O kapcsolatokat biztosító vezérlők a CPU részleg lapkáján találhatóak, ezeknek köszönhetően PCIe NVMe alapú tárhely, valamint ConnextX-7 típusú NIC is jelen lehet a fedélzeten – utóbbi PCI Express 5.0 x8-os csatolón keresztül dolgozhat.
A GPU egy speciális fejlesztés, ami ugyan a Blackwell architektúrára támaszkodik, viszont kifejezetten a kisformátumú, alacsonyabb fogyasztás mellett üzemelő asztali konfigurációkhoz optimalizálták, ennek megfelelően teljesítménye is limitált, de még így is kifejezetten ütőképes. A GPU nagyjából 31 TFLOP/s-os egyszeres pontosságú számítási teljesítmény elérésére képes, míg az Nvidia NVFP4-es formátuma mellett már 1000 TOPs számítási teljesítményt is fel tud mutatni, ami kifejezetten jól jöhet AI célokra. A GPU egy meglehetősen nagy, 24 MB-os másodszintű gyorsítótárat kapott, ami egy magasabb szintű gyorsítótárként funkcionálva a CPU számára is látható, ezáltal a két lapka között gyorsítótár-koherens hierarchia valósulhat meg.
Az Nvidia szerint a lapkák közötti kapcsolatot biztosító C2C link jóvoltából összesen nagyjából 600 GB/s-os adatátviteli sávszélesség elérésére van mód, méghozzá alacsony késleltetés mellett, így az adatmegosztás hatékonyan és gyorsan történhet. A 140 W-os TDP kerettel rendelkező lapka számos biztonsággal és virtualizációval kapcsolatos professzionális szolgáltatást kínál, valamint többféle megjelenítőt is képes kezelni, hála a DisplayPort Alternate Mode és a HDMI 2.1a támogatásnak.
A szóban forgó chip a DGX Spark formájában érhető el, ami a DGX Base OS segítségével üzemel és képes a vállalat AI keretrendszerének helyi futtatására. Az eszköz használatával létrehozott munkafolyamatokat később a nagyobb teljesítményű DGX rendszerekre is lehet skálázni, de akár a felhőben üzemelő kiszolgálókra is át lehet ültetni, vagyis a DGX Spark egyfajta inkubátorként működik.
A konfiguráció 3999 dolláros listaáron kapható, és a fedélzetén található GB10 Superchip a jelek szerint a konzumerpiacon is felbukkanhat a nem is oly távoli jövőben, némileg átdolgozott formában, az N1 és az N1x SoC egységek formájában, legalábbis az eddigi pletykák erre utalnak. A chip bőven elegendő CPU- és GPU-teljesítményt kínál ahhoz, hogy kiszolgálja a konzumerpiaci noteszgépeket és a kompakt asztali számítógépeket, illetve akár mobil munkaállomások fedélzetén is helyet kaphat majd.