Az Nvidia a GTC Japan alkalmával bemutatta a Tesla P4-es gyorsítókártya utódját, a Turing architektúra köré épülő, T104-es GPU-val ellátott T4-es modellt, amely bizonyos feladatokban akár tizenkétszer is gyorsabb lehet elődjénél, miközben TDP kerete ugyanakkora maradt.
A Tesla T4 elsősorban gépi tanuláshoz, azon belül is AI Inference munkafolyamat-típusokhoz passzol, vagyis a következtetésen alapuló, úgynevezett dedukciós tanulási módot segíti. Az új gyorsítótkártya alapját egy T104-es GPZ adja, ami 2560 CUDA maggal és 320 Turing Tensor maggal rendelkezik, fedélzeti memóriából pedig összesen 16 GB-nyi GDDR6-os lapkát kap, amelyekkel 320 GB/s-os maximális memória-sávszélesség érhető el. A TDP keret a korábbi modelléhez hasonlóan 75 watt maradt, vagyis az új kártya használatához továbbra sincs szükség külön PCIe tápkábelek bevetésére. A hűtésről az adott szerverházban található ventilátorok gondoskodnak majd.Az új gyorsítókártya többféle számítási módot is támogat, így az FP32, az FP16 és az INT8 mellett most már INT4, illetve INT1 típusú feladatok kezelésére is képes – utóbbi kettő a Tesla P4 esetében még hiánycikk volt. FP16-os terhelés alkalmával az újdonság 5,5 helyett már 65 TFLOP/s-os teljesítményt nyújt, INT8 terhelés esetén pedig 22 helyett 130 TFLOP/s-os tempó elérésére képes.
Az INT4 terhelésforma a P4 esetében még nem volt elérhető, így ezen a téren nem lehet összehasonlítani a két terméket, az viszont biztos, hogy a T4 esetében 260 GLFOP/s-os számítási teljesítmény elérésére lesz mód ilyen feladatok alkalmával.
A 40 SM tömbbel rendelkező Tesla T4 fedélzetén RT magok is jelen vannak, amelyek sugárkövetés vagy Virtual Desktop Infrastructure típusú terhelés esetén villanthatják meg képességeiket. Az új gyorsítókártya elődjéhez hasonlóan mesterséges intelligenciára támaszkodó videó feladatok kezelésére is képes. A különbség az, hogy az optimalizációknak köszönhetően az új modell hardveres kódolás és dekódolás terén kétszer nagyobb teljesítményt nyújt, mint elődje, azaz akár 38 Full HD videófolyam dekódolására is képes.
Az új gyorsítókártya a TensorRT Hyperscale platform segítségével többféle technológiát is támogat. Biztosított az összes fontos mélytanulási keretrendszer támogatása is, így a PyTorch, a TensorFlow, az MXNet és a Caffee2 használata sem jelent akadályt. Ezzel együtt TensorRT 5 is bemutatkozott, ami egy, a Turing Tensor magokra szabott futtatómotor és dedukció optimalizáló környezet, természetesen többféle számítási pontosság támogatásával felvértezve. A vállalat ezzel együtt a Turing architektúrára optimalizált CUDA 10-zel is előrukkolt, ami optimalizált könyvtárakat, programozási modelleket, valamint grafikus API-kkal való együttműködést kínál.
A Tesla T4 rövidesen elérhetővé válhat a mélytanulásban utazó partnerek számára, áráról azonban nem esett szó.