Az Nvidia a GTC 2026 alkalmával több érdekességről is lerántotta a leplet, ezek között volt egyebek mellett a 88 processzormaggal rendelkező Vera processzor is, amellyel a szerverpiacon szeretnének borsot törni az AMD és az Intel orra alá. A vállalat első embere el is árult jó néhány részletet az új fejlesztéssel kapcsolatban, amelyek alapján úgy tűnik, igencsak impresszív processzort tesznek le az asztalra. Az Nvidia szerint a Vera CPU alapját adó Olympus mag lényegében 50%-kal gyorsabb bármelyik x86-os maghoz képest, valamint energiahatékonysága is kifejezetten impresszív, hiszen ezen a téren 90%-nyi előnyben van a riválisok megoldásaihoz képest.
A Vera processzor összesen 88 maggal és 176 szállal gazdálkodik, architektúra terén viszont már nem az ARM kész megoldását használja, min a korábbi Grace, hanem egy saját fejlesztésű, az ARM v9.2-A architektúra köré épülő Olympus processzormagot, ami több szempontból is különleges. Az új processzormag egyik fontos előrelépése, hogy újragondolja az SMT, azaz a Simultaneous Multi-Threading technológiát, helyette pedig Spatial Multi-Threading módszert vet be, amelynél nincs időszeletekre osztva a kulcsfontosságú komponensek használata az adott processzormaghoz tartozó két szál között, helyette fizikailag különítik el a futószalag különböző komponenseit.
A normál SMT támogatásnál időszeleteket alkalmazva gondoskodnak arról, hogy a két szál felváltva érhesse el a szükséges erőforrásokat, az Nvida megoldásánál viszont valóban egyszerre futhat mindkét szál az adott magon, ami növeli az ILP (Intstrucion Level Paralellism) teljesítményét, plusz tervezhetőbbé teszi a teljesítményt is, hiszen az éppen üresjáratban lévő elemekre műveleteket irányíthat a rendszer, ezzel teljes kihasználtságot biztosítva.
A 88 processzormag ráadásul egyetlen doménen belül foglal helyet, így nincs szükség késleltetés-növelő NUMA-műveletekre, ami szöges ellentétben van azzal az úttal, amelyen a nagy magszámú x86-ös riválisok haladnak éppen. Ez javítja a késleltetést, egyszerűbbé teszi a programozást, javítja a sávszélességet, illetve a teljesítmény is hatékonyabban tervezhető. A processzormagokhoz összesen 162 MB-nyi megosztott harmadszintű gyorsítótár társul.
Az Olympus mag ráadásul ugyanúgy 10-wide Instruction Fetch és Instruction Decode Front End-et kapott, mint például az Apple M sorozatú chipjei, ami mellett még Neural Branch Predictor is jelen van a fedélzeten, így tovább növelhető az egyszálas teljesítmény – utóbbi egy órajel alatt két elágazás-becslést tud végrehajtani. A processzormagok közötti kapcsolatot biztosító mesh hálózat is fejlődött, ugyanis a Grace esetében még 546 GB/s volt a teljes memória-sávszélesség, ami átlagosan 7,6 GB/s-os sávszélességet jelentett magonként. Ehhez képest a Vera esetében már 1,2 TB/s a kombinált sávszélesség, azaz egy magra teljes terhelés esetén 13,6 GB/s-nyi sávszélesség jut, de ha a magokra eső terhelés nem egyenletes, akkor egyetlen magra akár maximum 80 GB/s-nyi sávszélesség is juthat, ami hatalmas gyorsulást hozhat a sávszélesség-intenzív feladattípusok esetében.
A memória-alrendszert egyébként 1,5 TB-os SOCAMM memóriamodulok alkotják, amelyeken LPDDR5-ös memóriachipek foglalnak helyet, azaz a korábbihoz képest háromszorosára nőtt a kapacitás. A processzor kapott NVLink-C2C támogatást is, ami a lapkák közötti kommunikációt biztosítja, méghozzá 1,8 TB/s-os adatátviteli sávszélesség mellett, ami pont duplája annak, amit a Grace bevethetett, a PCI Express 6.0-s sávszélességhez képest pedig hétszer gyorsabb. A kétprocesszoros rendszerbe is jól illeszkedő fejlesztés egyébként PCI Express 6.0-s és CXL 3.1-es támogatást egyaránt fel tud mutatni.
A Vera CPU speciális rackek formájában érkezhet, amelyek 256 darab Vera processzort tartalmaznak, mindegyiket folyadékhűtéssel látják el, valamint 74 darab Bluefield-4 DPU és ConnectX SuperNIC hálózati komponensek is rendelkezésre állnak. Egy-egy rack összesen maximum 400 TB-ny LPDDR5-ös rendszermemóriát foghat munkára, amihez 300 TB/s-os memória-sávszélesség társulhat. Az összesen 45056 szállal rendelkező rendszer összesen 22500 processzorkörnyezet párhuzamos és egymástól független futtatására ad módot.
Az Nvidia szerint a Vera processzor másfélszer nagyobb teljesítményt kínál sandboxonként, mint x86-os riválisai, miközben processzormagonként háromszor nagyobb memória-sávszélességet vehet igénybe és kétszer magasabb energiahatékonyság mellett dolgozhat. Az új fejlesztés a Grace processzorhoz képest másfélszer nagyobb IPC-t tud felmutatni, azaz másfélszer több műveletet tud végrehajtani órajelenként, ami óriási előrelépés, hiszen a generációk közötti teljesítménynövekedés ennél kisebb szokott lenni a processzorpiacon.
Kézenfekvő lenne azt gondolni, hogy a Vera CPU elsősorban a Meta számár készül, hiszen az Nvidia és a Meta között nemrégiben köttetett egy új üzlet, de arra is fény derült, hogy a vállalat az új platformot egyéb partnereknek is szállítja majd, amelyek között egyebek mellett a Nebius, az Alibaba, az Oracle, illetve a Coreweave is jelen van. A Vera processzorok persze a Vera Rubin platform szerves részét is képezik majd.
A Vera processzorok az Nvidia szerint már sorozatgyártásba kerültek, az első példányok leszállítása az év második felében indulhat meg.