Az Nvidia GTC Washington, D.C. 2025 rendezvényén sok érdekes téma szóba került, mármint a valódi közvetítés alkalmával, nem a vele párhuzamosan indított, kriptovaluta-csalás céljából készített deepfake tartalom részeként, amiről ebben a hírben írtunk. A valódi Jensen Huang egyebek mellett bemutatta a következő generációs Superchip-platformot, ami ezúttal a Vera processzor-architektúra, illetve a Rubin GPU-architektúra köré épülhet, és több tekintetben is jókora előrelépést hoz, amiből sokat profitálhatnak az AI adatközpontok üzemeltetői.
Az egyetlen nagy alaplap formájában érkező platform alapját összesen három chip adja: két darab Vera GPU, amelyek egyenként két darab lapkából állnak; valamit egy Rubin sorozatú, ARM architektúra köré épített processzor, ami a GPU-kat szolgálja ki. A GPU-k természetesen HBM4-es fedélzeti memóriát használnak, míg a rendszermemória LPDDR szabványú memóriachipekből épül fel. Az Nvidia vezetője szerint az új platform már tesztelés alatt áll, a vállalat fejlesztőcsapata dolgozik rajta, a sorozatgyártás viszont majd csak a következő év folyamán indulhat meg.
Alapok terén tehát arra számíthatunk, hogy minden egyes Rubin GPU fedélzetén két darab GPU lapka foglal helyet, ezek maximum 50 PFLOP/s-os számítási teljesítmény elérésére képesek az FP4-es feladatok alkalmával, valamint kapcsolódik hozzájuk 288 GB-nyi HBM4-es szabványú memória is, ami nyolc darab HBM4-res memóriachip-szendvics formájában lesz elérhető. Ezeket a GPU-kat egy Vera CPU szolgálja ki, ami összesen 88 darab processzormaggal és 176 darab szállal gazdálkodik, ARM alapon, az egyes Rubin GPU-kkal pedig NVLINK- C2C kapcsolaton keresztül kommunikál, méghozzá 1,8 TB/s-os adatátviteli sávszélesség mellett.
Az említett alaplap, ami nagyjából akkora, mint egy ATX formátumú PC-s alaplap, az NVL144 rack formájában akár 3,6 ExaFLOP/s-os maximális számítási teljesítményt is el tud érni FP4-es – dedukciós – feladatok esetén, míg az FP8-as – tréning – műveleteket 1,2 ExaFLOP/s-os számítási teljesítménnyel szolgálhatja ki. Az említett teljesítmény alapján a GB300 alapú NVL72-es rendszerhez képest akár 3,3-szor gyorsabb lehet az új NVL144-es konfiguráció, ami jókora előrelépésnek tekinthető. Az új rendszer 13 TB/s-nyi HBM4-es memória-sávszélességgel dolgozhat, valamint 75 TB-nyi gyors rendszermemóriát is tartalmaz majd. Az NVLINK és a CX9 kapcsolatok esetében duplázás következik be, már ami az elérhető maximális adatátviteli sávszélességet illeti: előbbinél 260 TB/s, míg utóbbinál 28,8 TB/s lesz a limit.
A 2026-ban debütáló rendszert 2027 folyamán a Rubin Ultra alapú NVL576 követi, amelynél ugyanúgy Vera architektúra köré épülő, 88 maggal és 176 szállal ellátott processzort használnak majd, viszont a Rubin GPU helyét a Rubin Ultra veszi át, ami már nem kettő, hanem négy lapkából áll, így 100 PFLOP/s körüli maximális FP4-es számítási teljesítmény elérésére lesz képes. A négylapkás GPU mellé 1 TB-nyi HBM4e típusú memória kapcsolódik, ami 16 darab memóriachip-szendvics formájában lesz elérhető. Az NVL576-os rendszer a tervek szerint 15 ExaFLOP/s-os maximális FP4-es és 5 ExaFLOP/s-os maximális FP8-as számítási teljesítmény elérésére lesz képes, gyors fedélzeti memóriából 365 TB-nyit használhat, a kommunikációt pedig 1,5 PB/s sávszélességű NVLINK kapcsolat biztosíthatja.
A következő lépcső a Vera Feynman Superchip lesz, ami majd valamikor 2028 környékén debütálhat: ez a fejlesztés a Vera CPU mellett Feynman alapő GPU-t tartalmazhat, mégohzzá következő generációs HBM memóriachip-szendviccsel karöltve.