Nvidia Tesla P100: brutálisan erős, Pascal alapú VGA

Az Nvidia egy brutálisan erős gyorsítókártyát mutatott be, amely rengeteg új lehetőséget kínál a HPC szegmens szereplői számára.

Nvidia Tesla P100: brutálisan erős, Pascal alapú VGA

Az Nvidia elnök-vezérigazgatója a most induló GTC 2016 amerikai állomásán – amit egy európai és egy japán is követ majd – egy érdekes nyitóelőadás keretén belül mutatta be a vállalat eddigi legkomolyabb Tesla sorozatú gyorsítókártyáját, amelyen már egy Pascal architektúra köré épülő, hatalmas teljesítményű GPU teljesít szolgálatot.

Az újdonság alapját egy GP100-as grafikus processzor adja, amely 610 négyzetmilliméternyi területet foglal és a TSMC 16 nm-es FinFET gyártástechnológiájával készül, méghozzá CoWoS® (Chip-on Wafer-on-Substrate) technológia segítségével. Utóbbi annyit jelent, hogy ugyanazon a szilícium lapkán található a GPU és a HBM2 típusú fedélzeti memória – a chip gyakorlatilag a Samsung 3D V-NAND memóriachipjeihez hasonlóan a TSV, azaz a vertikális összekötő vezetékek előnyeit kamatoztatja.

A Tesla P100 paraméterei a rendelkezésre álló adatok alapján. (Forrás: AnandTech)

HBM2-es fedélzeti memóriából egyébként 16 GB-nyi áll rendelkezésre, méghozzá négy darab 4 GB-os, 1024-bites HBM2-es chip formájában, az elérhető memória-sávszélesség értéke pedig 720 GB/s. A minden eddigi GPU-nál nagyobb GP100 a HBM2 memórialapkákkal együtt 150 milliárd tranzisztort tartalmaz, viszont önmagában „csak” alig több,mint 15 milliárd tranzisztorral bír. Egy-egy ilyen gyorsítókártya esetében 300 wattos TDP-re kell felkészülni.

Az óriási GPU óriási számítási teljesítményt nyújt, hiszen dupla pontosságú feladatok esetén 5,3 TFLOP/s-os, egyszeres pontosságú feladatok alatt 10,6 TFLOP/s-os, FP16-os módban pedig 21,2 TFLOP/s-os sebesség elérésére képes – utóbbi kifejezetten jól jön az újdonság által megcélzott Deep Learning szegmensben. A teljes pre-empció támogatással ellátott GP100-as grafikus processzor 49-bites virtuális címtartománnyal dolgozik, így az egyes alkalmazások számára nem csak a GPU, de a CPU teljes címtartományának elérését is lehetővé teszi. A korábbi megoldásoknál erre még nem volt mód, hisz csak akkora megosztott memória címtartomány elérésére volt lehetőség, mint amennyi fedélzeti memóriával gazdálkodhatott a GPU. Többkártyás rendszereknél a Tesla P100 PCI Express 3.0 x16-os csatolófelület helyett az Nvidia NVLink interfészét használja, ami a PCI Express 3.0-hoz képest nagyjából ötször nagyobb adatátviteli sávszélességet nyújt.

Az újdonság gyártása már megindult, szállítását pedig hamarosan megkezdik. A Tesla P100 lesz az alapja az Nvidia DGX-1 névre keresztelt szervermoduljának is, amelyben összesen nyolc darab ilyen videokártya foglal helyet, méghozzá úgynevezett Hybrid Cube Mesh rendszerben, két Xeon processzorral karöltve. Egy-egy ilyen rendszer 170 TFLOP/s-os FP16-os számítási teljesítményt nyújt, SSD alapú tárhelyből pedig 7 TB-nyit használhat.

A DGX-1 várhatóan június folyamán válik elérhetővé, ára pedig 129 000 dollár lesz. A vele felszerelt szerverek a következő év első negyedévében lesznek elérhetőek.

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward