Nvidia csúcskártya 4992 CUDA maggal, 24 GB VRAM-mal

Az újdonságon két darab GK210-es GPU lapul, amelyek a GK110 alapjaira épülnek, de néhány tekintetében jelentősen eltérnek tőle.

Nvidia csúcskártya 4992 CUDA maggal, 24 GB VRAM-mal

Az Nvidia az éppen zajló SC'14 alkalmával új professzionális szintű gyorsítókártyát mutatott be, ami a HPC szegmenst veszi célba – méghozzá nem is akárhogy. A Tesla K80 egy rettentően különleges gyorsítókártya, olyan, amihez hasonlót eddig még nem láthattunk. Tavaly, az SC'13 alkalmával mutatkozott be a Tesla K40, ami az első olyan gyorsítókártya volt, ami kiaknázta a GK110-e GPU összes erőforrását.

A Tesla K40 után azt gondolhattuk volna, hogy a Kepler alapú Tesla sorozat a csúcsra ért, de mint kiderült, nem így volt: a vállalat idén egy új Kepleres gyorsítókártya-szörnyetegről rántotta le a leplet. Az újdonság egy vadonatúj, GK210-es kódnévre keresztelt GPU köré épül, amelyből rögtön kettőt is elhelyeztek nyomtatott áramköri lapján.

Egy-egy ilyen Tesla K80-as gyorsítókártya optimális esetben – a GPU Boost-ban rejlő lehetőségek maximális kiaknázásával – 2,9 TFLOP/s-os maximális dupla pontosságú számítási teljesítményt nyújt, szimpla pontosságú számítási teljesítménye pedig a 8,7 TFLOP/s-os értéket is eléri. A papírforma alapján a Tesla K80 maximális órajel mellett 74%-kal gyorsabb a korábbi csúcsmodellnél.

Két nagyteljesítményű GPU-t nem egyszerű egy nyomtatott áramköri lapra integrálni – a siker érdekében itt-ott faragni kell az erőforrásokon. Emiatt nem is túl meglepő, hogy a GK210-es GPU 15 helyett csak 13 aktív SMX tömbbel rendelkezik, ami 2496 CUDA magot jelent. Az összesen 4992 CUDA maggal ellátott Tesla K80 esetében a GPU órajele 562 MHz és 870 MHz között helyezkedik el, egy-egy GPU pedig 384-bites adatsínen keresztül kapcsolódik a saját 12 GB-nyi GDDR5-ös fedélzeti memóriájához. A VRAM esetében 5 GHz-es effektív órajellel gazdálkodhatunk, így a 24 GB-nyi fedélzeti memória sávszélessége magonként 240GB/s.

A Tesla K80 a fentiek miatt már nem 235 wattos TDP-vel rendelkezik, mint elődei, hanem 300 wattossal. Utóbbi érték elérésében kiemelten fontos szerepet játszik a GPU Boost. A Tesla K80 energiahatékonysága legrosszabb esetben 2%-kal, legjobb esetben pedig 59%-kal jobb, mint a Tesla K40-é – az esetek többségében a tényleges energiahatékonyság valahol e két érték között helyezkedik el.

Az mindenképpen impozáns teljesítmény, hogy a két GPU-val ellátott, 300 wattos TDP-vel rendelkező Tesla K80 kétslotos bővítőkártya formájában érkezik. Emiatt a Tesla K80 segítségével azonos mennyiségű helyre sokkal nagyobb teljesítmény zsúfolható be, mint ha Tesla K40-es gyorsítókártyákat használnának, igaz, a hűtés is több fejtörést okozhat, hiszen az újdonságok passzív kivitelben érkeznek, így az adott szerverházat komoly szellőzéssel kell felvértezni.

A GK210-es GPU tulajdonképpen a GK110-es egység harmadik revíziójának tekinthető, amely az alapmodell által kitaposott ösvényt követi, ám jelentős változtatásokat is tartalmaz. A GK110-hez és a GK110B-hez képest az SMX regiszter mérete 256 KB-ról 512 KB-ra nőtt, a megosztott memória – vagyis az L1 Cache – pedig 64 KB helyett immár 128 KB-os. Ez a változás apróságnak tűnhet, ám fontos, mivel segít növelni az SMX-en belül az adatfeldolgozás sebességét, így növekszik a hatásfok, azaz a CUDA magok kihasználtsága is jobb lesz.

Az utolsó mozaik a GPU Boost támogatás, ami a Tesla sorozatban a K40 érkezésével debütált. A Tesla K40 idején a rendszerüzemeltetők három órajel közül választhatták ki az igényeknek és a körülményeknek legmegfelelőbbet, a Tesla K80 fedélzetén azonban már dinamikus GPU Boost működik, azaz a rendszer maga szabályozza a GPU órajelét – valahogy úgy, ahogy a GeForce videokártyáknál már megszokhattuk.

A Tesla K80 egy szokatlan terméknek tekinthető, olyannak, amilyen a Tesla sorozatban eddig nem volt. Az újdonság egy-egy GPU-ja persze alacsonyabb teljesítményt kínál, mint a Tesla K40-é, így azoknál a feladatoknál, amelyeket nem lehet hatékonyan több GPU-ra skálázni, a Tesla K40 még mindig jobb választás lehet. Más kérdés, hogy a HPC alkalmazások döntő többségét jól lehet több GPU-ra skálázni, így az esetek többségében – egy-két apró kiviteltől eltekintve – a Tesla K80 lesz a gyorsabb, olykor akár kiemelkedően is.

További jó hír, hogy a Tesla K80 érkezésével végre lehetőség nyílik rá, hogy 8 darab GK210-es GPU-val rendelkező 1U rendszert készítsenek a partnerek, amelynek dupla pontosságú számítási teljesítménye bőven meghaladja a 10 TFLOP/s-os szintet.

A Tesla K80 már elérhető a partnerek számára, sőt, a vele felszerelt konfigurációk is elérhetőek, igaz, az nem derült ki, hogy egy-egy ilyen gyorsítókártya-szörnyeteg pontosan mennyibe kerül. Egy évvel ezelőtt az egy GPU-s Tesla K40 5500 dolláros listaáron debütált – ennél az összegnél minden bizonnyal többe kerül majd a Tesla K80.

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward