Az AMD a napokban jelentette be, felvásárolnak egy ígéretes startupot, ami az AI-láz és a memória-krízis közepette nagyon jól szolgálatot tesz majd, ugyanis segít abban, hogy a rendelkezésre álló rendszermemóriát hatékonyabban használhassák az AI adatközpontok, ezáltal csökkennek a birtoklással kapcsolatos összesített költségek, valamint kitolódnak azok a korlátok is, amelyek korábban a DRAM kapacitás miatt voltak érvényben.
A MEXT lényegében egy AI alapú memória-használat optimalizáló algoritmust fejlesztett ki, amelynek feladata az, hogy az adatokat hatékonyan használhassa az adott rendszer és csak azok a tartalmak legyenek jelen a memóriában, amelyekre várhatóan tényleg szükség lehet, a többi adatot, amire előreláthatólag nem lesz szükség az aktuális munkafolyamat éppen zajló ciklusában, átmozgatja az algoritmus. Azt, hogy éppen mely adatokra tarthat igényt az éppen AI modellt vagy bármilyen egyéb feladatot futtató szerver, a MEXT által kifejlesztett Predictive Memory Engine próbálja eldönteni, méghozzá úgy, hogy folyamatosan tanulja a memória-hozzáférési mintázatokat, majd ezek alapján helyezi át azokat a tartalmakat, amelyekre valószínűleg nem lesz szükség.
Hogy ezek hova kerülnek? Mivel a memóriakapacitás értékes és rendkívül drága is, plusz az igényekhez képest eléggé véges, a startup fejlesztői azt találták ki, hogy az éppen nem kellő adatokat az AI segítségével kimozgatják a NAND Flash tárhelyre, helyükre így olyan tartalmak kerülhetnek, amelyekre tényleg szükség van. Ez azért fontos lépés, mert a mai modern AI infrastruktúrában jellemzően eléggé pazarló módon használják a memóriakapacitást, éppen ezért általában nem a CPU- vagy GPU-erőforrás korlátozza a lehetőségeket, hanem a memórialimit, ami az éppen zajló memóriakrízis közepette még fájóbb, mint amilyen korábban volt.
A prediktív algoritmus az AI modellek révén képes időben a memóriába másolni azokat az adatokat, amelyekre rövidesen szükség lesz, így a szoftver rögtön hozzájuk férhet, mintha eleve a memóriában lettek volna. Azokat az adatokat persze, amelyek a NAND Flash tárhelyre kerültek, szintén „láthatja” az éppen futó alkalmazás, ugyanis a Predictive Memory Engine transzparensen működik: a DRAM tehermentesítésére lefoglalt NAND Flash tárhely úgy jelenik meg a szoftverek számára, mintha az a rendszermemória része lenne.
Az AMD tervei szerint a technológiát alkalmazni fogják saját adatközpont-portfóliójukban, valamint tovább is fejlesztik annak érdekében, hogy az AI modellekhez tartozó, egyre csak növekvő adatkészletekkel lépést lehessen tartani, ugyanakkor csökkenteni lehessen a működési költségeket és a nagyméretű adatkészleteket gyorsabban lehessen munkára fogni. Az újítás összességében javítja a rendszer erőforrás-kihasználásának hatékonyságát, különös tekintettel a memóriahasználatra. Az optimális memóriakezelés a rendszer összteljesítményét is növelheti, de hogy pontosan mekkora mértékben, az az adott kiépítéstől és az éppen futó feladat komplexitásától függhet, illetve attól is, mennyire hatékonyan tudják „megjósolni” az AI modellek, mely adatokra lesz szükség a következő munkafolyamatban.
A speciális technológia segít az AMD termékportfóliójának versenyképesebbé tételében, valamint az AI adatközpontok teljesítményének optimalizálásában is, azaz mind a gyártó, mind pedig a partnerek jól járnak vele – legalábbis ez a cél.