Az AI-láz megállíthatatlanul pörög, igaz, több elemző is pedzegette már korábban, hogy a lufi előbb-utóbb ki fog pukkanni, ha a sok-sok tőkeberuházás mögé nem sikerül elég árbevételt állítani annak érdekében, hogy értelmezhető időn belül elkezdjen megtérülni a befektetés, az ugyanis ahhoz is szükséges, hogy a további tőkeberuházásokat finanszírozni lehessen.
Az AI éppen terjeszkedik a különböző iparágakban, egyre több és több területen lehet hasznos segéd, illetve egyre több dedikált gyorsító kap helyet az újabbnál újabb konfigurációkban, amelynek eredményeként egyre nagyobb hatást gyakorolhat a piacra, ez pedig a fenti problémát is elkezdheti majd orvosolni. Ebbe az irányba mutat az a lépés is, ami egy új processzor-bővítmény, az AI Computational Extensions nevet viseli, célja pedig az, hogy egységes terepet biztosítson a különböző AI munkafolyamatok számára az Intel és AMD processzorok terén, ugyanis szabványosított keretek között tudja gyorsítani a legfontosabb számítási feladatokat.
Ez rendkívül nagy jelentőséggel bír, hiszen az NPU-k terén is az a nehézség, hogy eléggé különböznek egymástól az egyes megoldások, ami a fejlesztők dolgát is megnehezíti. Az ACE keretén belül az x86-64 utasításkészlet-architektúra köré épülő processzorok egységes, egy kódsávval megcélozható dedikált fixfunkciós hardvereket tartalmaznak majd, amelyek sokkal hatékonyabban tudják elvégezni az AI feladatokat, mint a jelenlegi módszerek, ahol a feladat-végrehajtás nem túl optimális, csak úgy ahogy a teljesítmény és az energiahatékonyság sem.
Az ACE lényegében az AVX10 regiszterekre épül, ugyanakkor dedikált hardverre is támaszkodik, amit a következő generációs Intel és AMD processzorok egyaránt megkaphatnak, ezáltal a mátrix-szorzás műveletek, amelyek az AI munkafolyamatok sarokkövei, sokkal gyorsabban és hatékonyabban futhatnak majd az adott processzoron, ami jobb teljesítményt eredményez, jobb lesz az energiahatékonyság, az optimalizációk révén pedig még az overhead is csökkenni fog.
Az újítás megkönnyítheti a fejlesztők dolgát, hiszen rajta keresztül egy egységes hardvertípust kell megcélozniuk, ha ki akarják használni az ACE bővítményben rejlő lehetőségeket, a hagyományos, processzor-alapú munkavégzéshez képest pedig akár 16-szoros teljesítménynövekedés is elérhető, vagyis ennyivel több műveletet hajthat végre az adott központi egység, legalábbis elméletben. A gyakorlat ettől eltérő lehet és valószínűleg eltérő is lesz, hiszen az adott feladattól és implementációtól függ majd a konkrét teljesítmény. A klasszikus AVX10 alapú munkafolyamathoz képest az ACE több utasítást tud majd végrehajtani, jobban bánhat a memória-sávszélességgel, valamint az utasítások elosztásából és ütemezéséből fakadó extra terhelés (overhead) is kisebb lesz, ami jótékonyan hathat a fogyasztásra is.
Az ACE bővítmény támogatja majd azoknak az adattípusoknak a többségét, amelyek fontosak az AI-hoz kapcsolódó munkafolyamatok elvégzéséhez, vagyis egyebek mellett FP4, FP6, FP8, FP16, BF16, FP32, INT8, illetve INT32 támogatás egyaránt rendelkezésre áll majd, ráadásul natívan. Extra előny, hogy az AVX-10-zel ellentétben az ACE képes lesz használni a Compute Project MX blokk alapú formátumait is, azokat is natívan.
A fentieknek köszönhetően a fejlesztők azokat az idő- és késleltetés-kritikus feladatokat, amelyeknek mindenképpen hamar meg kell lenniük, igény esetén az NPU-ról áthelyezhetik a CPU ACE kompatibilis dedikált gyorsítóira is, ráadásul ezt az x86-64 utasításkészlet-architektúrán belül egy egységes, szabványos környezetben tehetik meg, ami mindenképpen nagy előny lesz majd.