Az Nvidia vezetője, Jensen Huang több érdekességet is bemutatott a GTC 2025 alkalmával, amelyek között egyebek mellett a Blackwell Ultra névre keresztelt újítás is jelen volt. Ez az aktuális információk alapján egy másfajta grafikus processzor köré épül, mint az eredeti Blackwell, azt viszont egyelőre sajnos nem árulták el, pontosan milyen hardveres különbségek mutatkoznak az újdonságok között. Annyi minden kétséget kizáróan kiderült, hogy a Blackwell Ultra sorozatot erősítő B300-as modell lényegesen gyorsabb lesz elődjénél, valamint 50%-kal több fedélzeti memóriát foghat munkára.
Ez a számok nyelvén azt jelenti, hogy az FP4-es számítási teljesítmény a korábbi 10/20 PetaFLOP/s-ról 15/30 PetaFLOP/s-ra emelkedik, már ami a Dense és a Spare értékeket illeti, azaz tényleg 50%-os gyorsulásra lehet számítani, de hogy ez a gyorsulás a többi adattípusnál is ugyanekkora lesz-e, azt még nem árulták el. A nagyobb számítási teljesítmény mellé ezzel egy időben 50%-kal több fedélzeti memória társul, ami azt jelenti, hogy a korábbi nyolc darab 24 GB-os HBM memóriachip-szendvicset itt már nyolc darab 36 GB-os memóriachip-szendvics váltja fel, azaz 192 GB-ról 288 GB-ra katapultál a memóriakapacitás. Az viszont nem derült ki, hogy a memória-sávszélesség továbbra is 8 TB/s marad-e, vagy ezen a téren is számíthatunk-e némi növekedésre, például órajel-emelésből fakadóan.
A magasabb FP4-es számítási teljesítmény mindenképpen segíteni fog a dedukciós képességek javításában, a nagyobb memóriakapacitás pedig arra ad lehetőséget, hogy a korábbinál több paraméterből álló nagy nyelvi modellekkel is dolgozhasson a rendszer, ezek ugyanis el fognak férni a fedélzeti memóriában.
A Blackwell Ultra szériát erősítő B300-as GPU felhasználásával természetesen készül GB300-as modell is, ami két darab B300-as grafikus processzort kombinál a korábbról már ismert Grace processzorral. Ez a fejlesztés a DGX GB300 NVL72 formájában válik elérhetővé, amiben összesen 36 darab GB300-as lap foglal helyet, azaz 36 darab Grace processzort és 72 darab GB300-as GPU-t foghat munkára az adott szerverplatform. A több memória és a magasabb teljesítmény természetesen a TDP keret növekedését eredményezi.
Az új fejlesztés jókora gyorsulást képvisel a Hopper architektúra köré épülő termékekhez képest. Az Nvidia példája szerint egy NVL72-es rack esetében 30-szor nagyobb teljesítmény elérésére van mód dedukcióval kapcsolatos feladatok terén, mint egy hasonló konfigurációban elérhető Hopper alapú rack esetében. Ez a gyorsulás persze elég sok területről származik, nemcsak a két architektúra közötti különbség okozza, hanem a több memória, a gyorsabb NVLink, valamint az optimalizációk hatására emelkedő FP4-es teljesítmény is. Míg egy Blackwell Ultra alapú rendszer a DeepSeek R1-671B modell alatt akár 1000 token/s teljesítmény elérésére is képes, addig egy hasonló Hopper konfigurációnál ez a teljesítmény már csak 100 token/s, azaz tízszeres gyorsulás látható, ami a feladatok elvégzéséhez szükséges időre is rendkívül nagy pozitív hatást gyakorol.
A tervek szerint a B300 alapú termékek még az év vége előtt, valamikor a második félév folyamán kerülhetnek forgalomba, arról azonban egyelőre nem esett szó, hogyan alakul az egyes újdonságok árazása.