Az Nvidia a tegnapi nap folyamán a GTC 2014-en már bemutatott egy érdekes terméket, ami nem volt más, mint a GeForce GTX Titan Z. A két darab teljes értékű GK110-es GPU-val ellátott videokártya szörnyeteggel kapcsolatban korábbi hírünkben találnak bővebb információt az érdeklődők.
A nem mindennapi videokártya mellett egyéb érdekességekről is szó esett. Az Nvidia kissé meglepő módon egy új, némileg átrendezett GPU útitervet mutatott be. A tavalyi útiterven a Volta még megjelenési időpont nélkül szerepelt, legfontosabb tulajdonsága pedig az volt, hogy beágyazott memóriát alkalmaz (Stacked DRAM), azaz a fedélzeti memória a GPU lapkáján kaphat helyet. A korábbi útiterven az időközben megjelent Maxwell 2014-es érkezési dátummal szerepel, legfontosabb tulajdonságaként pedig a Unified Virtual Memory támogatás volt feltüntetve.
A GTC 2014-en bemutatott új GPU útiterven a Maxwellnél már nincs jelen az Unified Virtual Memory támogatásra utaló megjegyzés – ez átkerült a következő architektúrához, ami a Maxwell után érkezik. A Maxwell esetében szoftveres úton persze elérhető az Unified Memory szolgáltatás, hála a CUDA 6-nak, ám itt csak félmegoldásról van szó, hiszen a CPU és a GPU memóriaterülete közötti másolásokat már nem a programozóknak kell elvégezniük, azt megoldja a szoftver, viszont emiatt sebességnövekedés nem mutatkozik – maximum a programozók munkája válik valamivel könnyebbé. Azzal kapcsolatban, hogy a második generációs Maxwell architektúra pontosan mit kínál majd, egyelőre nem osztott meg részleteket az Nvidia, valamint az is rejtély, mi várható ebben a tekintetben a professzionális felhasználóknak szánt termékek piacán.
A GPU útiterven a Maxwell neve alatt most érdekes módon a DirectX 12-es támogatást emeli ki az Nvidia, maga az architektúra pedig a terveknek megfelelően 2014 folyamán tényleg elrajtolt, hiszen a GeForce GTX 750-es sorozat tagjain Maxwell alapú GPU lapul. Második generációs Maxwell termékek érkezésére, amelyek elődeiknél magasabb teljesítményt kínálnak, még mindig lehet számítani, de ezek a jelek szerint nem vonultatnak majd fel semmiféle új szolgáltatást. Ezzel egy időben a korábban bejelentett Volta GPU architektúra megjelenését hátrébb tolták, a tokozáson helyet kapó beágyazott memóriát pedig már a Volta előtti GPU architektúra képviselői is megkapják, amelyek a Maxwell és a Volta közé ékelődnek be.
Itt meg is érkeztünk a Pascal GPU architektúrához, ami új szereplő az útiterven. A Maxwell és a Volta között érkező újdonság 2016 folyamán jelenhet meg és igen érdekesnek ígérkezik, ugyanis a Maxwell korábban ígért Unified Virtal Memory támogatása mellett a Voltánál feltüntetett beágyazott DRAM-ot is megkapja, azaz két fontos újítás egyesül majd benne. A GPU lapkára helyezett beágyazott memória 3D-s megoldás lesz, amelynél az egyes memórialapkákat TSV-k (Though-Silicon-Vias) kötik össze, függőlegesen. A Pascal esetében az Nvidia a JEDEC High Bandwidth Memory szabványát alkalmazza majd, a bemutatott Pascal prototípuson pedig csak tokozásra szerelt fedélzeti memória lapult. Érdekesség, hogy a korábbi Volta bejelentéssel ellentétben az Nvidia ezúttal nem határozott meg memória-sávszélességgel kapcsolatos célokat – korábban 1 TB/s-os értékről lehetett olvasni. Ennek oka a költségekkel magyarázható: meg kell találni a választ arra, hogy a vásárlók vajon mekkora memória-sávszélességet hajlandóak kifizetni.
Az Nvidia a Pascal architektúra kapcsán beszélt az NVLINK-ről is, ami elsőként a Pascal GPU architektúrával mutatkozik be. Hogy mi is ez? Dióhéjban: egy olyan új, főként szerverekbe szánt interconnect technológia, amely a PCI Express jelentette akadályokat próbálja leküzdeni. Az Nvidia célja az, hogy a különböző feladatok sebessége minél jobban skálázódjon több GPU-s rendszereken, ám ennek jelenleg gátat szab a PCI Express 3.0 a maga 16 GB/s-os adatátviteli sávszélességével – főleg, ha azt nézzük, hogy egy egyetlen GPU-val rendelkező videokártyán belül a GPU és a fedélzeti memória között 250 GB/s-nál is nagyobb sávszélesség áll rendelkezésre. A helyzet a PCI Express 4.0 érkezésével javulni fog, ám ez az Nvidia szemszögéből nézve még mindig édeskevés a kínált többlet. A vállalat mérnökei éppen ezért alkották meg az NVLINK-et, ami segít a kívánt sávszélesség elérésében.
A végeredményként létrejövő megoldás nagyon hasonlít a PCI Express-re, sőt, még úgy is kell programozni, mint a PCI Express-t, ám az új rendszer valódi pontból-pontba dizájnt alkalmaz és a működéséhez szükséges követelmények is szigorúbbak. Az Nvidia NVLINK blokkokból épül fel, amelyek egyenként 8 sávval rendelkeznek. Egy-egy sáv 20 Gb/s-os sávszélességet kínál, így a kombinált sávszélesség 20 GB/s-os értéket képvisel. Más szóval az Nvidia NVLINK egyetlen sávjának sebessége 20 GT/s, szemben a PCI Express 3.0-éval, amelynél 8 GT/s sebességgel kell beérni.
Az említett blokkokból több is alkalmazható két eszköz összekötéséhez annak érdekében, hogy a rendelkezésre álló sávszélesség kielégítő lehessen, de a blokkok akár egyéb eszközök csatlakoztatásához is bevethetőek – a felhasználható blokkok száma az adott termék típusától függ. Az NVLINK teljes egészében pontból-pontba típusú megoldást használ, így nincs szükség Switch-re vagy Root Complex-re. Utóbbi miatt az Nvidia megoldása nagyon hasonlít az AMD HyperTransport, illetve az Intel Quick Path Interconnect eljárásához.
A helyzet persze nem ennyire egyszerű, hiszen a felvázolt sávszélesség eléréséhez a PCI, illetve a PCIe típusú csatolófelületek nem elegendőek, hiszen ezek a csatlakozók túl rövidek. Az NVLINK éppen ezért újfajta, mezzanine típusú csatolót használhat, amit például több egymásra helyezett nyomtatott áramköri lap összekapcsolásához is be szoktak vetni. Magát a csatolót egyelőre nem mutatta meg az Nvidia, de az már most biztosnak tűnik, hogy az NVLINK alkalmazásához teljesen újfajta alaplap dizájnra lesz szükség.
Az új csatlakozó és az NVLINK interconnect az Nvidia szerint az energiahatékonyságot és az energiatovábbítást is javítja. Az NVLINK bájtonkénti energiahatékonysága magasabb lesz, mint a PCI Expressé, ami igen fontos szempont. Tápellátás tekintetében fontos előrelépés lesz, hogy az új csatlakozó a PCI Express-szel ellentétben 75 wattnál jóval nagyobb teljesítményt is le tud adni, így az adott kártya közvetlenül a csatlakozón keresztül szerezheti be a működéséhez szükséges áramot, nem kell majd külön PCI Express tápkábelekkel bajlódni. Ez csökkenti a rendszerekben tekergőző vezetékek számát, plusz a szellőzésre is jótékonyan hathat.
Az NVLINK a dolgok jelenlegi állása szerint a szerverek szegmensét veszi célba, a munkaállomások és az átlagfelhasználóknak szánt konfigurációk pedig továbbra is PCI Express alapú kapcsolatot használnak majd, ahogy manapság is.
A Pascal esetében rossz hír, hogy a köré épülő termékek szállítása majd csak valamikor a 2016-os év folyamán kezdődhet meg.
Az NVLINK és a Pascal érkezésére tehát még várni kell, de az Nvidia máris arról beszél, milyen irányba lesz érdemes elindulni a jövőben. A GPU-GPU kapcsolatot biztosító eljárás mellett CPU-GPU kapcsolatot biztosító interconnect is készülhet, aminél hasonló adatátviteli és szinkronizációs célokat tűztek ki a cég szakemberei, mint a GPU-kat összekapcsoló megoldás esetében. Az OpenPower konzorcium részeként az NVLINK úgynevezett POWER CPU megoldások létrehozására is alkalmas, igaz, ebben a témakörben pontos tervekről egyelőre nem hullott le a lepel. Az Nvidia előtt kétségtelenül nyitva áll az út ahhoz, hogy olyan ARM alapú processzort készítsen, amely NVLINK támogatással rendelkezik (project Denver?), de ez egyelőre csak találgatás, hiszen konkrét bejelentés nincs a témában. Amennyiben a tervből valóság lesz, úgy a létrejövő megoldás az AMD Torrenzájára hasonlíthat majd, ami korábban a süllyesztőben végezte. Utóbbinál HyperTransport alapú kapcsolat köthette volna össze a processzorokat és a grafikus processzorokat.
Az Nvidia ezzel együtt az NVLINK 2.0-s változatának egyes újításait is felvázolta. A Pascal utáni GPU architektúrával – azaz a Voltával – bemutatkozó újítás bevezetheti a gyorsítótár-koherenciát, ami teljesítménynövekedéshez vezet, és lehetővé teszi az alkalmazások heterogén módon történő futtatását is.
A fenti képekért köszönet az AnandTech munkatársainak!