Az Amazon elképesztően sokszínű vállalat, a világ legnagyobb webes szolgáltatójaként egyedi chipeket is tervez már egy ideje, hogy így tudjon a felhasználói számára még jobb szolgáltatást biztosítani. A cég most az AWS re:Invent eseményen beszélt arról, hogy két új chipdizájnt kezd alkalmazni, az egyik az adatközpontokat fogja segíteni, a másik pedig a mesterséges intelligencia terén lesz hasznosítható.
„Az AWS Graviton4 és az AWS Trainium2 jelentős előrelépést hoz az ár-érték arány tekintetében, valamint a hatékonyságot figyelembe véve is. Ezekkel kiválóan gyorsítható az ügyfelek nagy terheléssel járó munkafolyamatainak sokasága, például a gépi tanulás és a generatív MI terén” – emelte ki az Amazon.
Az AWS legújabb tervezéseiről beszélhetünk most, amiket a szakemberek az Amazon szolgáltatásához igazítva alkottak meg. Már mind a kettő lapka korábbi tapasztalatok alapján lett tovább tökéletesítve. Ezeket úgy alkották meg a chiptervezők, hogy tökéletesen összhangba lehessen hozni a harmadik féltől származó hardveres komponensekkel is, és ezáltal egy még jobb környezet születhessen.
A Graviton4 30 százalékkal nagyobb számítási kapacitással szolgál majd, mint az előző megoldás, miközben másfélszeresére növelték a tervezők a benne található processzormagok létszámát. Ebből egyértelműen látszik, hogy nem a tempó, hanem inkább a hatékonyság növelése volt a tervezők célja az AWS-nél. A Graviton3-hoz képest az újdonságot már 75%-kal nagyobb sávszélesség szolgálhatja ki. Az Amazon EC2 (Elastic Compute Cloud) égisze alatt ez lesz a leghatékonyabb széles körben kihasználható lapka.
Ha valakit kicsit mélyebben is érdekelnek a részletek, azt lehet tudni a Graviton4-ről, hogy 96 darab ARM Neoverse V2 mag dolgozik benne a korábbi 64 maggal szemben. A memóriavezérlője pedig 12 csatornás és DDR5 RAM-ok alkalmazását teszi lehetővé legfeljebb 5600 MHz mellett. Ezen a fronton is inkább a hatékonyság, nem pedig a még nagyobb tempó volt a cél. Valószínűleg már a TSMC 4 nm-es eljárásával készül a Gravion4, de ezt még nem tisztázta az Amazon (a Graviton3 már 5 nm-es volt).
A Trainium2 a mesterséges intelligencia feladatok gyorsításában már négyszer jobb lesz, mint az első generációs lapka volt. A 4-szer gyorsabb tréningezési képességét pedig EC2 UltraClustersen belül lehet majd kihasználni, ahol akár egyszerre 100 ezer chip is összekapcsolódhat, lehetővé téve az alapmodellek és a nagy nyelvi modellek rendkívül gyors feltanítását, Az eddigiekhez képest óriási előrelépésre lehet számítani. Ráadásul ezzel párhuzamosan a hatékonyság is kétszer jobb lehet, szóval időt és pénzt egyszerre lehet spórolni a Trainium2-vel.
Az új megoldással az Amazon a továbbiakban még több MI terén érdekelt startup figyelmét ketltehti majd fel. Az AWS-t használja jelenleg a nagyok közül az Anthropic, a Claude chatbot fejlesztője, de említhetnénk a Databricks nevét is. A jövőben valószínűleg egyre több generatív MI szolgáltatás jelenhet majd meg, és az Amazon szélesre tárja a kapuit az új belépők előtt.
A rendezvényen az is kiderült, hogy az Amazon elmélyítette a kapcsolatát az Nvidiával, és a vállalat nagy mennyiségben fogja alkalmazni az új H200 gyorsítókártyákat. Erről épp a napokban számolhattunk be részletesebben az Nvidia legutóbbi bejelentései nyomán. A H200 jelentős gyorsulást hoz, számos érdekességet tartogat a felépítése, és az Amazon is igyekszik majd a fejlesztés erényeit a lehető legjobban kamatoztatni a jövőben. Az is kiderült, hogy több mint 16 ezer GH200 superchipet alkalmaz majd az AWS.
Minden lehetőséget megragad az Amazon annak érdekében, hogy az AWS versenyképességét folyamatosan javítsa. A mostani bejelentések alapján arra lehet számítani, hogy a már jelenleg is piacvezető webes szolgáltatás még mélyebb gyökereket fog ereszteni. Számos olyan projekt megvalósulásához járulhat hozzá a jövőben, ami már a mesterséges intelligenciával kapcsolatos, és a friss fejlesztéseket fogja kihasználni.