Lehengerlő újdonságokkal veszi célba a szerverek és adatközpontok szegmensét az AMD

Az AMD a Data Center and AI Technology Premiere névre keresztelt eseményen, ami az Amerikai Egyesül Államokban, Kalifornia államban, San Francisco területén került megrendezésre, számos érdekes terméket mutatott be, amelyekről az alábbi összefoglaló formájában számolunk be. Az adatközpontok szegmensét célzó fejlesztések mellett néhány üzleti APU egység is megjelent, amelyek az asztali és a mobil konfigurációkban tűnhetnek fel a nem is oly távoli jövőben. Nézzük is, mi mindenről hullott le a lepel!

Végre bemutatkoztak az AMD EPYC sorozat nagy magsűrűségű tagjai, a Bergamo modellek

Már régóta tudni lehetett, hogy az AMD hamarosan bemutatja speciális, kifejezetten felhős alkalmazásokhoz fejlesztett processzorait, amelyek ezen a téren elsőnek tekinthetőek a piacon, hiszen x86 alapú, natív felhő-támogatással rendelkező termékek eddig még nem készültek. Az új modellek minden esetben a ZEN 4 architektúra speciális változatát használó ZEN 4c processzormagokat tartalmazzák, amelyek a lehető legnagyobb magsűrűség elérésének érdekében feleakkora területet foglalnak a lapkán, mint a normál ZEN 4 magok.

A maximum 128 maggal és 256 szállal dolgozó processzorok elsősorban azokat a szegmenseket veszik célba, amelyeknél fontos a magas energiahatékonyság, a munkafolyamatok jól párhuzamosíthatóak, valamint a késleltetéssel szemben is toleránsak. Ide tartoznak egyebek mellett a nagysűrűségű VM rendszerek, amelyek sok-sok virtuális gépet kínálnak az ügyfelek számára, de az adatelemző rendszerek, illetve a front-end webszolgáltatást biztosító rendszerek is ide sorolhatóak. A nagy magsűrűségű chipek a normál megoldásokhoz képes alacsonyabb órajeleken üzemelnek és fogyasztásuk is szerényebb, tokozás terén pedig ugyanúgy SP5-ös foglaltba illeszkednek, mint a maximum 96 processzormaggal rendelkező, ZEN 4 architektúra köré épülő EPYC Genoa modellek.

Az EPYC Bergamo szerverprocesszorok a maximum 128 processzormag mellett maximum 12 darab DDR5-ös memóriacsatornát is kínálnak, amelyekre DDR5-4800 MHz-es memóriamodulok kapcsolódhatnak. A ZEN 4c processzormagokat tartalmazó chipleteket a Floyd kódnévre keresztelt I/O lapkához kapcsolták, ami a memóriavezérlő mellett számos I/O vezérlőt is tartalmaz. Első körben összesen háromféle modell található az EPYC Bergamo sorozatban, amelyek mindannyian 256 MB-nyi megosztott harmadszintű gyorsítótárral rendelkeznek.

Érdekesség egyébként, hogy a ZEN 4c processzormagok nem tekinthetőek klasszikus E-Core típusú magoknak, vagyis órajelenként végrehajtható műveletek számát tekintve (IPC) megegyeznek a ZEN 4 alapú megoldásokkal. Az alapvető felépítés megegyezik a két magtípus között, a lényegi különbség annyi, hogy míg a ZEN 4 processzormagoknál 4 MB-nyi L3 Cache jut egy magra, addig ez az érték a ZEN 4c esetében mindössze 2 MB. A lényeges összehasonlítási pontokat a fenti táblázat tartalmazza.

A csúcsot a 128 maggal és 256 szállal felvértezett AMD EPYC 9754 képviseli, ami 2,25 GHz-es magórajelen és 3,1 GHz-es boost órajelen üzemel, TDP kerete pedig 360 W. Ebből a modellből készült egy „S” variáns is, ami az EPYC 9754S típusjelzést viseli, és nem rendelkezik SMT támogatással, vagyis a 128 maghoz 128 szál társul.

Egyéb tekintetben nincs különbség a két termék között. A harmadik az EPYC 9734, ami már csak 112 maggal és 224 szállal rendelkezik, hiszen minden chiplet esetében letiltottak két processzormagot. Órajelek terén itt 2,2 GHz-es alap- és 3 GHz-es boost érték van érvényben, míg a TDP keret már csak 320 W-os. A Bergamo chipek az AMD szerint 2,7x-es javulást képviselnek energiahatékonyság terén, ami abszolút nem lesz mellékes az érdeklődő partnerek és ügyfelek számára.

Maguk a Bergamo architektúra az AMD diája szerint nyolc darab 16 magos chipletet tartalmaz, ahol a processzormag és az L3 Cache mérete mindössze 2,48 négyzetmilliméter, szemben a ZEN 4 modelleknél megszokott 3,84 négyzetmilliméteres értékkel, hiába azonos a gyártástechnológia. A fenti felépítés láttán felmerülhet a kérdés: vajon készülhetnek később 12 chipletet tartalmazó AMD Bergamo szerverprocesszorok, amelyek 192 maggal rendelkeznek? Elméletben igen, hiszen a „normál” AMD EPYC szerverprocesszorokból már rendelkezésre áll 12 darab chiplettel szerelt megoldás.

Amennyiben elkészülnek a 192 maggal ellátott verziók, az Intel érkező, 144 maggal ellátott Sierra Forest processzorai, amelyek elsőként tartalmaznak energiahatékonyságra optimalizált processzormagokat a szerverekbe szánt processzorkínálaton belül, extra nehézségekre számíthatnak. A 192 magos felépítés egyébként az Ampre esetében már felmerült az AmpreOne modell esetében, és valószínűleg a Google, illetve a Microsoft saját egyedi lapkái is hasonlóan sok maggal rendelkeznek majd a későbbiekben, ha megjelennek.

Érkezik az MI300-as gyorsítókártya-sorozatot erősíti MI300a és az MI300X

Az AMD már korábban bejelentette, MI300 névvel speciális APU egységeket készítenek, amelyek az AI és a HPC piacot vehetik célba. Nemrégiben be is mutatkozott két modell, amelyek közül az Instinct MI300A egy speciális, összesen 13 chipletből álló megoldás, összesen 146 milliárd tranzisztorral, aminél több tranzisztort csak a lentebb bemutatott MI300X tartalmaz.

Az egyetlen chip formájában érkező MI300A fedélzetén összesen 24 darab ZEN 4-es processzormag található, amelyek mellett egy CDNA 3 architektúra köré épülő gyorsító-motor is jelen van, fedélzeti memóriából pedig összesen 8 darab HBM3-as memórialapka-szendvicset rejt a tokozás, így összesen 128 GB-nyi memóriával gazdálkodhat a rendszer. Az 5 nm-es CPU és GPU lapkák összesen kilencen vannak, amelyeket négy darab lapkára helyezték fel 3D tokozás keretén belül. Ezek az „alap” lapkák aktív összekötőként funkcionálnak és nemcsak az I/O forgalom kezeléséről gondoskodnak, de a memóriaforgalmat is kezelik, sok más egyéb mellett.

Az Instinct MI300-as sorozatban egy olyan modell is felbukkant, ami már nem tartalmaz CPU magokat, csak és kizárólag GPU magokkal rendelkezik, ez pedig nem más, mint az MI300X. A CDNA 3 architektúra köré épülő GPU magok ebben az esetben összesen 192 GB-nyi HBM3-as fedélzeti memóriával rendelkezik, ami 24 GB-os HBM3-as memórialapka-szendvicsekből áll.

Az AMD szerint az újítás, ami 153 milliárd tranzisztorból épül fel. Ez a chip összesen 12 különböző chipletet tartalmaz, amelyek között 5 nm-es csíkszélességgel készülő GPU lapkák és 6 nm-es gyártástechnológiával legyártott I/O lapkák foglalnak helyet. A GPU részleg egészen pontosan 8 chipletből áll, míg az I/O részlegben összesen 4 chiplet foglal helyet.

Az AMD szerint a chip a nyolc memória-csatornán keresztül összesen 5,2 TB/s-os memória-sávszélesség elérésére képes, míg az Infinity Fabric adatátviteli sávszélessége 896 GB/s-os értéket képvisel. Az újdonság képességeit jól jellemzi, hogy akár 80 milliárd paraméterből álló nagy nyelvi modellek (LLM-ek) is futhatnak rajta, ami az egy GPU-ból álló rendszerek esetében rekordnak tekinthető. Komoly fegyvertény az is, hogy az Nvidia H100-hoz képest 2,4x-es-es előny mutatkozik HBM sűrűség terén, azaz az AMD terméke nagyobb modellek kezelésére is képes, mint a rivális megoldások.

Nagy különbség az MI300A és az MI300X között, hogy az MI300A esetében egy memóriatartomány és egy NUMA tartomány áll rendelkezésre, azaz egységes memória-hozzáféréssel dolgozhatnak a CPU és a GPU magjai. Az MI300X ezzel szemben már koherens memóriát használ a GPU fürtök esetében. A gyorsítótár-koherens memória előnye, hogy a CPU és a GPU között kevesebb adatmozgatásra van szükség, ami segít a késleltetés csökkentésében, miközben javítja a teljesítményt és az energiahatékonyságot is. Utóbbi azért fontos, mert sokszor a GPU és a CPU közötti adatmozgatások több energiát emésztenek fel, mint maga a számítási feladat.

A bemutató alkalmával az AMD egy érdekes demóval kedveskedett a jelenlévőknek, amelynek keretén belül egy 40 milliárd paraméterből álló Falcon-40B modell került elő, ez egyetlen MI300X típusú GPU-n futott, ám azt sajnos nem árulták el, milyen teljesítményt sikerült elérni. Az LLM-nek azt a feladatot adták, írjon egy verset a rendezvény színhelyéül szolgáló San Frascisco városáról. Ekkora LLM egyébként most először futott egy olyan rendszeren, ami mindössze egyetlen GPU-val rendelkezik.

Az MI300-as sorozat tagjai mellett előkerült az AMD Instinct Platform is, ami összesen nyolc darab MI300X típusú GPU-t tartalmaz egyetlen szerveralaplapon, méghozzá 1,5 TB-nyi HBM3-as fedélzeti memória társaságában. A platform nagy előnye, hogy OCP megfelelősséggel rendelkezik, azaz nyílt forráskódú dizájnról van szó, ami az AMD szerint elősegíti a platform alkalmazásának gyorsítását. Ezzel szemben az Nvidia hasonló területre szánt MGX platformjai zártak.

Az MI300A verzió mintapéldányai az AMD szerint már készülnek, azaz rövidesen szélesebb körben is elérhetőek lehetnek a partnerek számára. Az MI300X-ből viszont, ami 8 GPU lapkából áll, majd csak a harmadik negyedévben válnak elérhetővé az első mintapéldányok, a rajtra pedig a negyedik negyedév folyamán kerülhet sor.

Itt a második generációs 3D V-Cache gyorsítótárat használó EPYC Genoa-X sorozat

Az AMD a Milan-X sorozat utódjául szánt Genoa-X családot is bemutatta, amelynek tagjai elsősorban azokban a feladatokban jeleskedhetnek, amelyeknél előnyt nyújt a 3D V-Cache: ilyen például a CAD tervezés, valamint az elektronikai tervezőprogramok is, számos egyéb terhelésforma mellett. Felépítés terén ezúttal is 7 nm-es csíkszélességgel készített, 64 MB-os kapacitású SRAM lapkákból álló megoldásokkal találkozhatunk, amelyek a chipletek tetején kapnak helyet, így a lapkánként elérhető L3 Cache kapacitása lényegében triplájára ugrik. Ezeknél a lapkáknál már szintén a második generációs 3D V-Cache technológia kapott helyet, csak úgy, ahogy a RYZEN 7000X3D sorozat egyes képviselőinél is.

A ZEN 4 architektúrát használó Genoa-X modellek esetében a csúcsot ezúttal az 1,15 GB-os L3 Cache kapacitással rendelkező Genoa-X 9684X képviseli, ami 96 maggal és 192 szállal rendelkezik. Az L3 Cache kapacitása a korábbi modellnél bevetett 768 MB-nyi L3 Cache-hez képest 43%-kal nagyobb, ami sok területen jöhet jól, és a Milan-X modellekhez képest 50%-kal megemelt magszám is hasznos extra lesz a piacon.

A Genoa-X sorozatú szerverprocesszorok SP5-ös processzorfoglalatba illeszkednek, azaz a meglévő infrastruktúra használható marad velük, a TDP keret pedig 320 W-tól egészen 400 W-ig terjed – előbbi a 16 maggal, utóbbi a 96 maggal rendelkező modellre érvényes.

A Genoa-X sorozat a belsős tesztek alapján versenyképesnek ígérkezik az Intel aktuális processzor-generációjának tagjaival szemben, ám a teljes képet majd csak a később érkező független tesztek mutatják meg.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

LEHENGERLŐ ÚJDONSÁGOKKAL VESZI CÉLBA A SZERVEREK ÉS ADATKÖZPONTOK SZEGMENSÉT AZ AMD

TOP 5 AZ IPON-ON