Megérkezett az Nvidia első Volta GPU-ja

MEGÉRKEZETT AZ NVIDIA ELSŐ VOLTA GPU-JA

Az új architektúrával készült chip a HPC szegmenst veszi célba, és minden túlzás nélkül brutálisan nagy lett!

Svindler ^2

Az Nvidia a GTC-n bejelentette az első Volta architektúrás GPU-ját, a GV100-ast, ami bár használható grafikus feladatokra is, alapvetően a HPC szegmenst veszi célba, és ezúttal különös figyelmet fordítottak a mélytanulásra is a cég mérnökei. A chip a TSMC még nem túl kiforrott 12 nm-es gyártósorain készül és gigászi lett. Hiába a kisebb csíkszélesség, ekkora GPU-ja még sosem volt az Nvidiának. Egész konkrétan 815 mm²-ről beszélhetünk, és ekkora területre 21,1 milliárd tranzisztort sikerült bepréselni. Olyan nagy ez a chip, hogy a TSMC technológiájának a határait feszegeti, sokkal nagyobbat gyártani sem tudnának. Valószínűleg a kihozatali arány nem lehet túl rózsás ilyen paraméterek mellett, de az ezzel szerelt kártyákat nem is aprópénzért fogják árulni.

A Pascal architektúrás GP100-hoz képest 40%-kal nőtt a CUDA magok száma, összesen 5376 van a chipen, de jelenleg nem tudunk olyan megoldásról, ami mindet használná (ami a selejtarány miatt biztos nem véletlen, valószínűleg nem is lesz ilyen). A gyorsítótárak méretét jelentősen megnövelte az Nvidia: egy-egy shader tömbben 24+64KB helyett immár 128KB konfigurálható cache van, a memóriavezérlőkhöz kapcsolódó ROP-ok mellett pedig 512KB helyett 768KB, tehát az egész chipen 6MB van. Az alapvető arányok nem változtak, tehát dupla pontosságú számításokat fele olyan gyorsan, míg FP16-os számításokat kétszeres sebességgel képes elvégezni az architektúra az FP32-höz képest.

Utóbbinál azonban van egy kis csavar a mélytanulásos rendszerek miatt. A shader tömbökben megjelentek az úgynevezett Tensor magok, amik csak ezzel foglalkoznak. 4*4-es mátrixokkal végeznek műveleteket, két FP16-ost össze tudnak szorozni, majd hozzáadni egy FP16-oshoz vagy FP32-eshez egyetlen órajel alatt. Ezeknek az új magoknak hála (nyolc van belőlük egy tömbben), ha az adott szoftver ki tudja használni őket, négyszerezhető az FP16-os teljesítmény.

Memóriából megmaradt a HBM2, ami továbbra is 4096 biten csatlakozik, tehát négy chipet pakolnak a GPU mellé az interposer rétegre. Kapcsolattartásra már második generációs NVLinket használ a GPU, ami azt jelenti, hogy 20 helyett 25GB/s-os kétirányú kapcsolatra képes linkenként, és négy helyett hatot tartalmaz, tehát 2*150GB/s a maximális sávszélessége.

Az első olyan kártya, ami az új GPU-val érkezik, a Tesla V100-as lesz. Ezen összesen 5120 CUDA mag aktív, és 1455MHz-es boost órajelen működik. Ennek köszönhetően az FP32-es teljesítménye 15TFLOPS, ami bő 40%-os előrelépés a Pascal alapú Tesla P100-hoz képest. A memória sávszélesség nem fejlődött ennyit, mert bár az elméleti maximum 1TB/s lenne, egy kicsit visszafogták az órajeleket, így 900GB/s-nál tetőzik a V100 sebessége. A TDP maradt 300W, de konfigurálható lesz, ha valamiért alacsonyabbra lenne szükség vállalati környezetben.

Az első termék, amiben már a V100-as lesz, a DGX server frissített változata lesz, a DGX-1V. Ebben 8 V100-as várja majd, hogy megizzasszuk, potom 149 000 dollárért. Valamikor a harmadik negyedévben érkezik majd, míg az OEM, az utolsó negyedévben tehetik majd rá a kezüket az újdonságra.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

MEGÉRKEZETT AZ NVIDIA ELSŐ VOLTA GPU-JA

TOP 5 AZ IPON-ON