Az Oracle és az Nvidia együttműködéséből létrejöhetett az elő olyan AI munkafolyamatokra fejlesztett szuperszámítógép-fürt, ami már Zettascale osztályú teljesítményszint elérésére képes, ráadásul nem is elégszik meg az 1 ZettaFLOP/s-os álomhatár áttörésével, rögtön 2,4 ZettaFLOP/s szinten kezdi meg pályafutását. A maga kategóriáján belül ez egy rendkívül komoly mérföldkő, amit az Oracle Cloud Infrastructure keretén belül lehet munkára fogni.
Az új szuperszámítógép-fürtöt a felek tervei szerint mind Nvidia Hopper, mind pedig Nvidia Blackwell alapú AI gyorsítókból össze lehet állítani. A tervek szerint hálózati összeköttetés terén is többféle lehetőség közül lehet választani, vagyis az Nvidia Quantum-2 Infiband alapú hálózata mellett a RoCEv2 alapú, ultra-alacsony késleltetéssel dolgozó, ConnectX-7 NIC vagy ConnectX-8 SuperNIC alapú kommunikációs alrendszer is elérhető az opciók között, attól függően, mi a cél.
A H100-as gyorsítókkal ellátott verzió esetében az OCI Supercluster-ek 16384 GPU-ból állhatnak, amelyek 65 exaFLOP/s-os számítási teljesítményt nyújtanak INT8/FP8 pontosság mellett, a kombinált hálózati sávszélesség pedig 13 pbps (petabit/s) értéket képviselhet.
A második opció már H200-as gyorsítókkal felvértezett OCI Supercluster-ekből áll, amelyeknél egészen 65536 GPU-ig skálázható a rendszer, így maximum 260 exaFLOP/s-os teljesítmény érhető el INT8/FP8 pontosság alkalmazása mellett.
A csúcsot minden kétséget kizáróan azok az OCI Supercluster-ek képviselik, amelyek már Blackwell B200 alapú AI gyorsítók köré épülnek, ezekből szám szerint maximum 131 072 darab kaphat helyet egy nagy szuperszámítógép-fürtben. A legmodernebb AI gyorsítók révén lehetőség nyílik a 2,4 zettaFLOP/s-os számítási teljesítmény elérésére, ugyancsak FP8/INT8 alapokon.
A csúcskategóriát képviselő OCI Superclusterek az Oracle szerint több,mint háromszor annyi AI gyorsítót tartalmaznak, mint a Frontier szuperszámítógép-fürt, az ugyanis csak 37 888 darab AMD Instinct MI250X GPU-t foghat munkára, és hatszor több GPU található bennük, mint amennyit a többi hyperscaler alkalmazhat a piacon.
Az új, kifejezetten nagy teljesítményt kínáló AI infrastruktúrából már több vállalkozás is profitál, például a WideLabs és a Zoom csapata is igénybe veszi az óriási számítási teljesítményt saját AI-jal kapcsolatos fejlesztési folyamataik felgyorsítására, természetesen a szuveneritás feletti kontroll mellett.
Az OC Supercluster-ek Blackwell alapú verziói az Nvidia GB200 NVL72 típusú, folyadékhűtéssel ellátott szekrényekből felépülő termékeit használják, amelyekben 72 darab GPU kommunikálhat egymással, méghozzá 129,6 TB/s-os kombinált adatátviteli sávszélesség mellett. Az Oracle szerint az Nvidia Blackwell alapú GPU-i köré épülő termékek a következő év első felében válnak elérhetővé szélesebb körben, idén ugyanis még limitált lesz a termékek elérhetősége. Arról egyelőre nem tett említést a vállalat, mikor válnak elérhetővé a Blackwell alapú OCI Supercluster-ek, de alighanem erre is rövidesen fény derülhet.