Elrajtolt az Ampere architektúra és az A100-as GPU

ELRAJTOLT AZ AMPERE ARCHITEKTÚRA ÉS AZ A100-AS GPU

Az A100-as jelölés ezúttal nem csak a GPU-t, hanem a köré épülő HPC gyorsítókártyát is jelöli.

Víg Ferenc (J.o.k.e.r)

Az Nvidia első embere ma online formában volt kénytelen megtartani a GTC 2020-as rendezvényre szánt előadását, ugyanis a COVID-19 okozta nehézségek miatt most csak erre volt mód – erre is csak némi csúszással kerülhetett sor, ugyanis a GTC 2020 eredetileg márciusra lett időzítve.

Ahogy azt a korábbi kis videó alapján sejthettük, az aktuális előadás főszereplője az Ampere architektúra volt, illetve a köré épülő első és egyben legnagyobb GPU, az A100-as modell. 2017-ben a Volta architektúrával, illetve a GV100-as GPU-val már nagyot gurított a gyártó a piacon, így most elég magas lécet kellett átugraniuk az Ampere architektúrával és az új GPU-val annak érdekében, hogy a fejlődés lendülete töretlen maradhasson. Míg a GV100-as GPU „csak” 21,1 milliárd tranzisztort tartalmazott, azaz már önmagában is igen komoly mérnöki teljesítményt jelentett a megalkotása, addig az A100 erre alaposan rálicitál, méghozzá úgy, hogy a lapka kiterjedése 815 négyzetmilliméterről „csak” 826 négyzetmilliméterre növekszik.

Igen ám, de közben igen nagy ugrás következett be gyártástechnológia terén, hiszen a 12 nm-es FFN helyett már 7 nm-es 7N gyártástechnológia köré épül az új lapka, természetesen ugyanúgy a TSMC gyártósorain, mint elődje. A tranzisztorok számát azonban jelentősen megnövelték, így azokból most összesen 54,2 milliárd áll rendelkezésre, vagyis tényleg nem túlzott Jen-Hsun Huang a sütögetős videónál: ez a GPU jelenleg a világ legnagyobbja a maga kategóriájában.

Az Ampere architektúra köré épülő újdonság teljesítmény terén is szép előrelépést hoz mind egyszeres-, mint dupla pontosságot igénylő műveletek esetén, valamint bevezet egy új FP32 jellegű számítási formátumot is, ami a TF32 nevet viseli. A Tensor részleg szintén megújult és gyorsabb lett, ugyanis az FP16-os teljesítmény két és félszeresével növekedett az előző generációhoz képest, valamint kibővítették a használható formátumok körét az Int8/4 támogatással is, hála a harmadik generációs Tensor technológiának.

Sőt, a Tensor magok most már FP64-es munkafolyamatokra is befoghatóak, ami igen komoly előrelépés. A GPU-hoz HBM2-es memórialapkák kapcsolódnak, amelyek szintén gyorsultak, valamint a memória-adatsín is szélesebb lett, ami együttesen azt eredményezi, hogy a memória sávszélesség közel duplájára, 900 GB/s-ról 1,6 TB/s-ra katapultált. A memória-alrendszer öt darab 1024-bites adatsínből áll, amelyek összesen 5120-bites adatsínné állnak össze. Noha a fotók alapján hat darab HBM2-es lapkaszendvics kapott helyet a GPU két oldalán, az Nvidia szerint a jelenlegi modelleknél csak 5 aktív chipet használnak, a hatodik pedig a jelek szerint csak "dummy" lapka, vagyis akkor egy 1024-bites adatsín inaktív lehet, akár például a kihozatali arány miatt is. Ezek alapján nincs kizárva, hogy később az A100-as lapkából egy több erőforrással ellátott változat is megjelenhet egy újabb gyorsítórkártya fedélzetén, ami már hat HBM2 lapkaszendvicset használhat, azaz így már 6144-bites adatsín állhat rendelkezésre.

Meglepő érdekesség, hogy az A100-as GPU igazából összesen 128 SM tömböt tartalmaz teljes kiépítésben, ám az aktuális kiadásnál csak 108-at engedélyeznek. Gyakorlatilag az SM tömböknek csak 85%-a aktív, szemben a GV100-as GPU-val, ahol az SM tömbök 95%-a volt használható. A hibátlan A100-as lapkákat minden bizonnyal egy új, később érkező termék számára teszi félre az Nvidia, ám ezzel kapcsolatban hivatalos tájékoztatás érthető módon nincs.

Az új kártya a GPU-hoz hasonlóan az A100-as jelölést viseli, formátum terén pedig a szokásos SXM köré épül, ami egy mezzanine-stílusú kártyát jelent, ahogy az a borítóképen is látható. A számítási teljesítmény és egyéb paraméterek javulásával, illetve a tranzisztorszám jelentős növekedésével a TDP keret is érezhetően nőtt, ugyanis most már 300 és 350 W helyett 400 W-ot képvisel, amit a klasszikus PCIe alapú megoldásokkal nem igazán lehet kiszolgálni.

Az új gyorsítókártya igazán komoly lépésnek minősül a HPC piacon, az architektúrával kapcsolatban azonban egyelőre nem sok részletet árult el a vállalat, vagyis a mélyebb technikai adatokra, illetve a lényeges újításokra majd csak később derülhet fény. Az viszont már teljesen biztos, hogy az Ampere architektúra nem csak a HPC szegmensben jut szerephez a közeljövőben, hanem a konzumerpiacra szánt megoldások terepén is, azaz Ampere alapú GeForce-ok is érkezhetnek még idén. Ezek a korábbi pletykák alapján valamikor szeptember folyamán rajtolhatnak el.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

ELRAJTOLT AZ AMPERE ARCHITEKTÚRA ÉS AZ A100-AS GPU

TOP 5 AZ IPON-ON