Egy ideje már nem titok, hogy az OpenAI csapata egy saját fejlesztésű AI gyorsítón dolgozik, a folyamatban pedig a Broadcom csapata is segíti őket. A legfrissebb hírek alapján a munka remekül halad, már az elkövetkező hónapok folyamán elkészülhet az új AI gyorsító, már ami a terveket illeti, így a TSMC-nél le lehet majd gyártani az első kézzel fogható példányokat, azaz a „tape-out” fázis kezdetét veheti. A Reuters információ szerint, ha minden a terveknek megfelelően halad, és nem jön közbe semmilyen váratlan esemény, 2026 folyamán tömegtermelésbe is kerülhet az új gyorsító, természetesen a TSMC üzemeinek köszönhetően.
Maga az egyedi AI gyorsító egy úgynevezett Systolic Array típusú felépítést alkalmazhat, ami azt jelenti, hogy azonos feldolgozóegységekből állhat, amelyek rácsszerű elrendezésben foglalnak helyet a lapkán, ezek az elemek pedig mátric- vagy vektorszámításokat végezhetnek. Az oszlopokba is sorokba osztott feldolgozó egységek egymással összeköttetésben működhetnek, az adatok pedig keresztül pulzálhatnak a tömbön egyfajta futószalag-szerű kivitelben. Az egyelőre még nem derült ki, hogy a feldolgozó egységhez pontosan milyen memóriát használ majd a vállalat – szóba jöhet a HBM4 és a HBM3E is. A gyártástechnológia azonban a TSMC 3 nm-es osztályú csíkszélességei közül kerül ki, ennek pontos típusát viszont még nem nevezték meg.
Az OpenAI a korábbi hírek szerint a Broadcom segítségét kérte az új AI gyorsító megtervezésében és összeállításában, ami jellemzően úgy szokott történni, hogy az adott vállalat házon belül kifejleszti a legfontosabb megkülönböztető IP-t, vagy legalábbis definiálja a Broadcom szakemberei felé az elképzeléseit, majd a Broadcom csapata ehhez hozzáadja a működéshez szükséges további komponenseket, például az általános célú processzormagokat, a memóriavezérlőket, illetve az I/O vezérlőket, illetve a csatolókat is, és végül összeállítja a végső dizájnt. Az OpenAI tervezőcsapatát Richard Ho vezeti, aki korábban a Google TPU-inak fejlesztésében is részt vett, vagyis van tapasztalata a témában. A szakember csapatának létszáma nemrégiben emelkedhetett a duplájára, azaz most már 40 fő dolgozik az AI gyorsító fejlesztésén, ami soknak tűnik, de az Amazon vagy a Google erőforrásaihoz képest ez még mindig elenyésző létszám, hiszen az említett cégeknél jellemzően több száz mérnököt tudnak ráállítani hasonló feladatokra.
Az OpenAI számára így is vastagon megéri a munka, ugyanis a friss AI gyorsító birtokában egyrészt energia- és költséghatékonyabban tudja majd elvégezni házon belül a különböző AI-hoz kapcsolódó feladatokat, amelyek első körben jellemzően a dedukcióhoz kapcsolódnak, nem pedig az LLM-ek tréningezéséhez, később azonban, ahogy ütőképesebbé válik a dizájn, utóbbiak felé is el lehet majd indulni. A másik előny, hogy saját AI gyorsító birtokában változik a tárgyalási pozíció a jelenlegi beszállítókkal, például az Nvidiával szemben, extra kedvezményeket is ki tud majd alkudni a vállalat. Az energiahatékonyság és a költséghatékonyság, valamint a saját feladatokhoz jobban passzoló dizájn miatt a fejlesztéshez kapcsolódó, jellemzően több száz millió dolláros költség könnyedén visszajöhet, viszonylag rövid időn belül, amennyiben platformonként egynél több processzort fejlesztenek, akkor ugyanis az egy processzorra jutó fejlesztési költségek csökkennek, de amúgy is megérheti saját AI gyorsítót készíteni.
Teljesítmény terén ugyan az efféle fejlesztések jellemzően elmaradhatnak attól, amit az Nvidia méregdrága AI gyorsítói kínálnak, viszont a chipek előállítása olcsóbb és működésük is energiahatékonyabb, ami összességében segít abban, hogy bőven megtérüljenek a fejlesztésre fordított költségek – ha minden a terveknek megfelelően alakul, és nem csúszik hiba a dizájnba. A költség- és energiahatékonyan működő AI gyorsítók azért is jöhetnek jól, mert segítségükkel olcsóbban futtathatóak az ügyfelek AI modelljei, ami összességében a piac számára is pozitívum lehet.
Amennyiben az OpenAI első egyedi AI gyorsítója körül minden rendben halad, és a fejlesztést a következő hónapok folyamán tényleg be tudják fejezni, akkor akár egy évvel később már a chipek sorozatgyártása is megindulhat, azaz 2026 közepére több chip is rendelkezésre állhat, azaz az év második felében szolgálatba állhatnak az új gyorsítók köré épülő szerverfürtök.