Az Intel egy nagyon fontos fejlesztést mutatott be a Vision 2024 alkalmával, ami nem más, mint a Gaudi sorozat legfrissebb tagja, a Gaudi3. Ez a modell a Habana Labs által kifejlesztett Gaudi2 helyére érkezik, a vállalatot még 5 esztendővel ezelőtt vásárolta fel az Intel. A soron következő fejlesztés, vagyis a Gaudi3 több területen is komoly előrelépést hoz elődjéhez képest, sőt, az AI és HPC piaci gyorsítók szegmensében piacvezetőnek számító Nvidia termékeivel szemben is képes felvenni a kesztyűt, méghozzá elég ígéretes eredményeket felmutatva.
A Gaudi3 alapját két darab lapka adja, amelyek a TSMC műhelyében készültek, méghozzá 5 nm-es osztályú csíkszélesség alkalmazása mellett. A két lapka egyenként 32 darab Tensor magot tartalmaz, ezek 5. generációs megoldások, amelyek a Gaudi2-nél alkalmazott 24 Tensor maghoz képest előrelépést hoznak. Az egyes lapkák 48 MB-nyi SRAM-ot is kaptak, így a teljes tokozás összesen 96 MB-nyi SRAM-ot, valamint 64 darab ötödik generációs Tensor magot tartalmaz.
Az SRAM esetében a memória-sávszélesség igen magas, 12,8 TB/s-os értéket képvisel, de a tokozás tartalmaz még némi HBM2e típusú fedélzeti memóriát is. Míg a Gaudi2 esetében a HBM2e lapkák csak 2,45 TB/s-os memória-sávszélességgel gazdálkodtak, addig a friss fejlesztés már 3,7 TB/s-os memória-sávszélességet vethet be, plusz még a memória kapacitása is növekedett, hiszen 96 GB-nyi helyett immár 128 GB-nyi HBM2e lapka fogható munkára.
Az új AI és HPC piaci gyorsító többféle kivitelben érhető el. A PCI Express formátumú kártya, azaz a HL-388-as dizájn esetében a PCI Express 5.0-s csatolófelületet használják, méghozzá 16 sáv alkalmazása mellett. Ez a verzió a hírek szerint 450 W és 600 W közötti TDP kerettel rendelkezik ami ebben a kategóriában nem túl gyakori. A gyártó ezzel egy időben OAM formátumú kiadásokat is készített, amelyek a HL-328, HL-325L és a HL-335 jelöléseket kapták.
A TDP keret modelltől függően 450 W-tól egészen 900 W-ig terjed. A HL-328-as és HL-325L típusú gyorsítók léghűtést alkalmaznak, amit az adott szerver rendszerhűtői biztosítanak, így 450 W-nyi és 900 W-nyi TDP keretet kell kordában tartaniuk. A 900 W-os TDP kerettel rendelkező HL-335-ös verzió ezzel szemben már folyadékhűtéssel üzemelhet.
Hogy milyen teljesítményre számíthatunk az újdonságok esetében? Egyelőre sajnos csak gyártói számok állnak rendelkezésre, amelyeket érdemes egészséges gyanakvással fogadni. A Gaudi3 az Intel előrejelzései szerint átlagban 1,4x-es és 1,5x-es közötti gyorsulást tud elérni a rivális Nvidia H100-hoz képest, méghozzá attól függően, éppen milyen nagy nyelvi modellről van szó (LLM).
A dedukciós feladatok alkalmával az adott feladattól függ a teljesítmény alakulása, a 10%-os lemaradástól a 70%-os, illetve ennél is nagyobb előnyig többféle eredmény is látható. A H200-hoz mérve már 20%-os hátrány és 3,8x-os előny is mutatkozik az egyes mérések alkalmával, az átlagos gyorsulás mértéke itt már csak 1,3x-os. Maga a Gaudi3 az Intel adatai szerint energiahatékonyság terén sem rossz, ugyanis 1,2x-es és 2,3x-os mértékben múlja felül a piacvezető Nvidia H100-as modelljeit, ami mindenképpen jó hír, hiszen azt mutatja, az Intel mindenképpen szeretné felvenni a versenyt az Nvidiával az AI és HPC piaci gyorsítók terén, és az irány igazából nem rossz.
A gyártói összehasonlítások ezúttal csak és kizárólag az Nvidia H100-as és H200-as modelljeire korlátozódtak, az AMD Instinct sorozatának tagjait nem mérték össze a Gaudi3-mal, pedig az AMD MI300A és MI300X sorozatú megoldásai eléggé ütőképesek lettek. Azt sem szabad elfelejteni, hogy az Nvidia már a Blackwell alapú termékeit is bejelentette, amelyek jókora gyorsulást hoznak Hopper alapú társaikhoz képest, így az Intel Gaudi3-nak nem lesz könnyű dolga, ha versenyezni szeretne velük. A gyártó tervei szerint a Gaudi3 lényegesen olcsóbb lesz, mint az Nvidia termékei, ám azt nem árulták el, pontosan milyen árakra számíthatnak majd a piac szereplői. Jó árazás esetén mindenképpen kifoghat némi szelet az Intel az Nvidia képzeletbeli vitorlájából.
A Gaudi3 az Intel tervei szerint még az év első felében elérhetővé válik a partnerek számára mintapéldányok formájában, majd az év második felében nagyobb volumenben is elkezdik szállítani. Remélhetőleg hamarosan megjelennek az első független tesztek is, amelyekből kiderül, hogyan teljesítenek egymáshoz képest az Nvidia, az Intel és az AMD megoldásai.