Az Nvidia a SIGGRAPH idejére egy igen komoly meglepetést tartogatott, ugyanis a vállalat első embere, Jen-Hsun Huang bemutatta az első olyan grafikus processzort, amely már a Volta után érkező Turing GPU architektúra köré épül – vagyis a Turing végül is egy új architektúraés nem egy új bányászhardver, ahogy azt korábban pletykálták. Az új GPU kisebb, mint a GV100, mégis hatalmas számítási teljesítményt nyújt, és még extra erőforrást is kapott. A bemutató alkalmával a Quadro RTX sorozatra is fény derült, amelynek tagjai az első olyan videokártyák, amik sugárkövetéssel kapcsolatos feladatokhoz is kaptak némi extra erőforrást – ez az úgynevezett RT (Ray-Tracing) mag.
Bemutatkozik az első Turing GPU
A Turing architektúrára támaszkodó újdonság 754 négyzetmilliméteres kiterjedéssel bír, fedélzetén pedig nem csak a szokásos shader tömb foglal helyet, de Tensor magok is, plusz újításként a fentebb említett RT mag is várja a feladatokat. Összehasonlításképpen a GV100-as GPU, ami a Volta architektúrát használja, még 815 négyzetmilliméteres kiterjedéssel bír. Az új Turing GPU az információk szerint „csak” 18,6 milliárd tranzisztorból épül fel, ezzel szemben a GV100-as Volta esetében még 21,1 milliárd tranzisztor alkotta az egységet.
Huang szerint a lapkához maximum 48 GB-nyi fedélzeti memória csatlakozhat, két Quadro RTX videokártyát NVLinken összekapcsolva pedig 96 GB-nyi koherens fedélzeti memóriához juthat a rendszer. A 14 GHz-es effektív órajelen ketyegő GDDR6-os fedélzeti memória 384-bites adatsínen kapcsolódik a GPU-hoz, a memória-sávszélesség értéke így 672 GB/s.
A szóban forgó, vagyis a legnagyobb GPU összesen 4608 CUDA magot állíthat csatasorba, így egyszeres pontosságú számítási teljesítmény terén 16 TFLOP/s-os lebegőpontos számítási teljesítményre számíthatunk, amellyel párhuzamosan 16 TIP/s integer számítási teljesítmény is rendelkezésre áll. A legnagyobb GPU összesen 576 Tensor magot kapott, amelyek FP16-os műveleteknél 125 TFLOP/s-os, INT8-as műveleteknél 250 TOP/s-os, INT4-es számítások alkalmával pedig 500 TOP/s-os teljesítmény elérésére képesek. Az új, vagyis a Ray-Tracing (RT) magok esetében 10 Giga Rays/s teljesítmény áll rendelkezésre
A GPU kijelző vezérlője HDR támogatást, 8K-s DisplayPort támogatást és VirtualLink támogatást is kínál – utóbbi a VR headsetek kiszolgálását segíti egy USB-C porttal, amelyen keresztül az adatátvitel, a tápellátás és a videójelek átvitele is megoldható, ahogy arról korábban már írtunk. Van még a fedélzeten NVLink támogatás is, ami 100 GB/s-os sávszélességet biztosít és arra is lehetőséget ad, hogy a grafikus processzorok hozzáférjenek egymás fedélzeti memóriájához. A GPU része még a fejlett videó motor, ami akár 8K-s HEVC tartalmakat is képes valós időben kódolni – és a korábbinál 25%-kal magasabb bitráta elérésére képes.
A GPU mellé 16 Gb-es kapacitású Samsung GDDR6-os memóriachipek kapcsolódnak, méghozzá 384-bites adatsínen keresztül – legalábbis a csúcsmodellnél. A memóriachipek effektív órajele 14 GHz lesz, ami 672 GB/s-os memória-sávszélességre elegendő.
Az első Turing alapú videokártyák
A fentebb említett Turing grafikus processzor elsőként az Nvidia Quadro RTX sorozatában kap helyet. Itt összesen három modellel találkozhatunk: az RTX 8000-es, az RTX 6000-es és az RTX 5000-es kártyával. A negyedik negyedév folyamán érkező újdonságok közül természetesen a Quadro RTX 8000 képviseli a csúcsot a maga 4608 CUDA magjával, 576 Tensor magjával, 10 GRays/s RT számítási teljesítményével és 48 GB-nyi fedélzeti memóriájával. Az NVlink támogatás jóvoltából könnyedén összekapcsolható két ilyen termék, így 96 GB-nyi fedélzeti memóriára és jelentősen magasabb teljesítményre tehetünk szert. Ezért 10 000 dollár körüli összeget kér majd el a vállalat.Egy szinttel lejjebb az RTX 6000 helyezkedik el, ami ugyancsak 4608 CUDA maggal, 576 Tensor maggal és 10 GRays/s RT számítási teljesítménnyel rendelkezik, de fedélzeti memóriából már „csak” 24 GB-nyit kap, feltehetően szintén 384-bites memória-adatsínre csatlakozva. Ebben az esetben szintén rendelkezésre áll az NVLink támogatás, hogy két ilyen kártya teljesítményét kombináljuk, a listaár pedig 6300 dollár lesz.
A legolcsóbb, ugyancsak Turing GPU-val szerelt Quadro RTX modell az RTX 5000-es lesz, ami már csak 3072 CUDA maggal, 384 Tensor maggal és 6 GRays/s RT számítási teljesítménnyel érkezik, fedélzeti memóriából pedig 16 GB-nyit kap (valószínűleg 256 biten). Ez a változat szintén megkapja az NVLink támogatást, ára pedig 2300 dollár lesz. USB-C videó kimenet mindegyik modellen lesz, így mindegyik támogatni fogja a VirtualLink szabványt is, ahogy azt fentebb már említettük.
A Quadro RTX család tagjai valamikor a negyedik negyedév folyamán válnak elérhetővé kereskedelmi forgalomban.