Az AMD következő generációs AI platformjával kapcsolatban felröppent néhány pletyka, amelyek alapján úgy tűnt, az MI455X alapú Helios rackek jelentős késéssel érkezhetnek meg a piacra.
Az ok az elcsúszó gyártás, ami miatt a partnerek is később kaphatják meg hőn áhított Helios Rack rendszereiket. A SemiAnalysis munkatársai szerint az első MI455X UALoE72 rendszerek gyártása az év második felében alacsony volumenben indulhat meg, ami a gyártással kapcsolatos késéseknek köszönhető, majd a tömegtermelés valamikor 2027 második negyedévében indulhat meg. Azt nem részletezték, pontosan miért csúszik a gyártás.
Az AMD csapata igyekezett gyorsan megcáfolni a SemiAnalysis munkatársainak értesüléseit: a vállalat szoftverfejlesztésért felelős részlegének vállalati alelnöke, Anush Elangovan arról tájékoztatta a nagyérdeműt, továbbra is a terveknek megfelelően halad a munka, ami 2026 második felében történő megjelenést jelent. Azt persze nem részletezte, hogy az év második felében a nagy volumenben történő sorozatgyártás is megindul-e, de a cáfolat alapján úgy sejthető, hogy igen.
Maga a Helios rack rendszer összesen 72 darab Instinct MI455X típusú AI gyorsítóval rendelkezik majd, amelyek összesen 31 TB-nyi HBM4-es fedélzeti memóriát oszthatnak be. A rendszer FP4-es számítási teljesítménye 2,9 exaFLOP/s lesz, míg az FP8-as számítási teljesítmény 1,4 exaFLOP/s magasságában helyezkedhet el – előbbi a dedukciós, utóbbi a tréning jellegű munkafolyamatok esetén fontos. Az első rack szintű megoldások várhatóan UALink összekötők segítségével működnek majd annak érdekében, hogy az együttműködés hatékony, a teljesítmény pedig kompromisszumoktól mentes lehessen.
A dolgok jelenlegi állása alapján úgy néz ki, hogy eleinte nem konkrétan UALink, hanem UALink on Ethernet alapokon működik majd az infrastruktúra, ami alacsonyabb teljesítmény elérését teszi lehetővé. Az nem derült ki, hogy a késésért az UALink felel-e, vagy egyéb okok állnak-e a háttérben, viszont az Astera Labs időközben megerősítette, az UALink alapú platformok termelésének felfuttatása nem 2026-ban, hanem 2027-ben esedékes. Reméljük, ezzel kapcsolatban rövidesen tisztul a kép – az sincs kizárva, ez a speciális helyzet okozott valamilyen félreértést a késéssel kapcsolatban.
Közben az AMD riválisánál jobban alakul a következő generációs platformok körüli munka, mint kéne, ami azt jelenheti, hogy 3-6 hónappal hamarabb dobhatják piacra az NVL72 VR200-as platformot, vagyis akár már az idei év második negyedévében is elérhetővé válhat. Jensen Huang, az Nvidia vezetője január folyamán már utalt rá, hogy a Vera Rubin platform gyártása már megindult, így a friss hírek fényében könnyen lehet, hogy a partnerek a várnál hamarabb hozzájuthatnak az újdonságokhoz.
Az Evercore ISI elemzője, Mark Lipacis úgy látja, az Nvidia előnyt kovácsolhatott abból, hogy egyes beszállítók a tiltások miatt nem tudják Kínába szállítani termékeiket, éppen ezért felszabaduló kapacitásaikat az Nvidia szolgálatába állítva segítettek felgyorsítani a termékfejlesztési folyamatot, ami azt eredményezte, hogy a Rubin 3-6 hónappal előrébb jár az ütemtervben lefektetett tempóhoz képest. Ez alapján egyesek szerint nem lenne meglepő, ha a Rubin szállítások még az idei év második negyedévének vége előtt megindulnának. A hiperskálázók persze már tesztelik a Vera processzorokat és a Rubin GPU-kat, valamint a validációs folyamatok is megindultak már.
Ha az Nvidia a vártnál hamarabb elkészül az NVL72 VR200 platformmal, miközben az AMD-nek valamilyen szinten el kell csúsztatnia a Helios rack platform UALink alapú verzióját, az azt jelentheti, hogy az Nvidia tovább erősítheti piacvezető szerepét az AI gyorsítók és az AI szerverek szegmensében, ezzel pedig gondoskodhat arról is, hogy a fejlesztők továbbra is az ő platformjait válasszák modelljeik fejlesztéséhez.