Szinte lehetetlen ma úgy felütni egy IT-vel foglalkozó újságot, hogy ne jöjjön szembe egyből pár hír, ami a mesterséges intelligencia alkalmazásával foglalkozna. Főleg a mélytanulásos algoritmusok használatára repült rá a piac, hiszen olyan feladatokra tudunk velük gyors megoldást nyújtani gépekkel is, amikre eddig nem, vagy csak nagyon körülményesen. Nem csoda hát, hogy egyre több hardverben bukkannak fel olyan feldolgozók, amiket dedikáltan az MI feladatok gyorsítására szánnak. Az nVidia is elég mélyen benne van a témában, a professzionális piacon rengeteg terméket ajánl erre a célra (is). Kezdetben az általános shadereket használták fel a számítások elvégzésére a grafikus vezérlőkön, majd tavaly a Volta architektúrában megjelentek a Tensor magok, amik már kifejezetten MI számítások gyorsítására voltak felkészítve, és párhuzamosan lehetett használni őket a shader mag többi részével. Ezeket örökölte meg a Turing, és így a GeForce sorozatban lévő RTX kártyák is.Na de mi szüksége van egy játékosnak Tensor magokra (vagy ahogy mostanában a mobilokban hívják őket, neurális gyorsítóra)? Hát, az a helyzet, hogy ha az nVidia nem talált volna feladatot ezeknek a magoknak, akkor jelenleg kb. semmi. Persze nem lehetetlen (sőt!), hogy a jövőben a játékokban is MI-vel fognak megoldani ezt azt, de még nincs olyan játék a piacon, ami kihasználná az extra számítási kapacitást, és ez valószínűleg még jó ideig így is maradt volna, ha az nVidia nem mutatja be a Deep Learning Super-Samplinget avagy a DLSS-t, aminek egy kicsit csalóka a neve. Super-Sampling élsimítás alatt normál esetben azt értjük, hogy a beállítottnál nagyobb felbontáson rendereljük le a játékot, majd azt visszaskálázzuk a szükséges felbontásra, így szüntetve meg a „recéket”. Például 1920x1080-as felbontásnál 4x SSAA-t használva valójában 4K-ban renderel a kártya, majd ebből a 4K-s képből állítja elő az 1080p-set. Könnyen belátható, hogy bár a végeredmény nagyon szép, borzasztóan erőforrás igényes a dolog, magasabb kiinduló felbontások esetében pedig egyenesen használhatatlan a jelenlegi teljesítményszintek mellett.
A DLSS algoritmus nem így működik, de SSAA segítségével tanították. A tanulási szakaszban több ezer képet mutattak neki, majd azoknak a 64x-es SSAA változatát (igen, az brutálisan túltolt, szinte felesleges szint, de mindent a minőségért, a tanulási szakaszban még ráérünk, nem az ezredmásodperceket számoljuk, úgyhogy beleférnek 4K esetében a 32K-s képek). Az algoritmus a kapott képből aztán megpróbál maga előállítani egy élsimított változatot. Ezt összehasonlítják a 64x SSAA-s képpel és a látottaktól függően állítgatnak egy kicsit az MI beállításain, és ez így megy addig, amíg elégedettek nem lesznek a végeredménnyel.
DLSS és DLSS 2X: mi a különbség?
Két változata létezik az algoritmusnak, az egyik a sebességre megy rá, a másik a képminőségre. Az alap DLSS-re azt mondja az nVidia, hogy jóval gyorsabb, mint TAA (Temporal Anti-Aliasing), amit sok játék használ (például a Final Fantasy XV). Ez egy utófeldolgozós élsimítási eljárás, ami az előző képkockát is felhasználva próbálja elmosni az éleket. Az egyetlen probléma vele, hogy néha túlságosan is „jól” sikerül neki, tehát mosott lesz a kép, ráadásul az átlátszó dolgokkal sem ápol jó viszonyt.
Már a GamesComos bemutató alkalmával gyanús volt, hogy az nVidia szerint az új kártyák 30-40%-kal gyorsabbak a régieknél, de ha DLSS-t használunk, ez bizony lehet 80-100% is. Mivel a TAA használata átlagosan 10-15%-os FPS csökkenéssel jár, így könnyen belátható, hogy a DLSS még akkor sem lehetne ennyivel gyorsabb, ha egész konkrétan nem kerülne semmibe. Mi a trükk, honnan jön a teljesítmény?
Nos, a teljesítményre optimalizált DLSS esetében alacsonyabb felbontáson renderel a kártya, majd ebből csinál egy magasabb felbontású, élsimított képet. Így azért már egy picit sántít az összehasonlítás az előző generációval, ami a tesztek alatt valóban 4K-ban renderel, és arra alkalmaz élsimítást.
A DLSS 2X, ami a minőségre megy rá, már a natív felbontást használja, és abból állít elő egy lépésben élsimított képet (tehát a kezdeti félreértésem ellenére nem hoz létre magasabb felbontásút, amit aztán visszaskálázhat, legalábbis az nVidiával folytatott beszélgetésem alapján ezt szűrtem le). Ennek az eredményeivel nem is dobálódzott az nVidia a diagramjain, és még teszt sincs, amivel megnézhetnénk, így fogalmunk sincs, hogy milyen sebességgel teszi ezt.
DLSS a gyakorlatban
Egyelőre egyetlen játék sincs, ami kihasználná a Tensor magokat, de már van pár tucat cím, amikről tudjuk, hogy a közeljövőben megjelenik bennük DLSS támogatás. Addigis abból tudunk kiindulni, ami van, és az nem sok. Az nVidia hozzáférést biztosított számunkra az Unreal motoros Infiltrator tech demó DLSS-es változatához, de ami sokkal fontosabb, hogy a Final Fantasy XV benchmark módosított példánya is az SSD-n landolt. Mivel ez egy létező játékra épít, amit egyébként is használunk a tesztjeinkben, így már bőven van mivel hasonlítgatni.
Sajnos DLSS 2X mód nincs benne, tehát csak a teljesítményre optimalizált változatot tudtuk kipróbálni, és egyelőre úgy néz ki, hogy szinte minden fejlesztő erre fog rágyúrni. Mielőtt rátérnénk az eredményekre, fontos kiemelni, hogy a DLSS csak és kizárólag a Turing architektúrás kártyákon fut, a Tensor magokat használva, tehát nem lehet a régebbi generációkon a shader magon elindítani (ezért üresek a 1080 Ti eredményei).
A méréseink körülbelül az nVidia számait támasztották alá, csak mi két hasonló súlycsoportban lévő kártyát raktunk egymás mellé, az RTX 2080-ast, és a GTX 1080 Ti-t. A kapott Final Fantasy benchmarknál nem lehet játszani a beállításokkal, csak fixen TAA-val vagy DLSS-sel lefuttatni, de a pontszámokból kiindulva a TAA mód a teljesen maximumra húzott alap benchmarknak felel meg (tehát még a GameWorks opciók is fel vannak tekerve). A DLSS valószínűleg ugyanezeket a beállításokat alkalmazza, csak az új élsimítási eljárással.
Jól látszik, hogy míg 4K-ban, TAA-t használva fej-fej mellett teljesít a két kártya, a DLSS-sel csúnyán elhúz az RTX 2080-as. Persze ne feledjük, hogy alacsonyabb felbontáson renderel. Hogy pontosan mekkorán, azt a Digital Foundrynak sikerült kiderítenie, a képváltásoknál egyetlen képkocka erejéig ugyanis látszik az eredeti felbontás, ami 2560*1440 pixel. (Vannak olyan információk, amik szerint a felbontás dinamikus, de erre utaló jeleket egyelőre nem találtunk.)
Le is mértük gyorsan, hogy mire képes a kártya ezen a felbontáson, hogy lehessen némi elképzelésünk arról, a DLSS milyen gyorsan is végzi a dolgát.
Nos, míg a TAA csak 7% csökkenéssel jár, addig a DLSS 26%-kal ha így nézzük, de ne feledjük, hogy a végeredmény egy 4K-s kép lesz, és a DLSS sokkal jobban kezeli az átlátszó objektumokat. Ennek köszönhetően hiába az alacsonyabb indulófelbontás, a DLSS által generált képet tényleg nehéz megkülönböztetni a 4K-s TAA-s képtől. Sajnos a benchmarkokban nincs lehetőség nézelődni és megállítani a játékot, hogy screenshotokat elemezgessünk, de a már emlegetett Digital Foundry elemzésben videón egymás mellé rakták a két változatot, érdemes megnézni legalább az első pár percét.
Amit látunk, alacsonyabb felbontás ide vagy oda, elég impresszív. Vannak pillanatok, amikor kiszúrható a DLSS alacsonyabb induló felbontása, de mozgás közben ez igen ritka, és még előnyei is vannak. A DLSS 2X pedig megszünteti majd a felbontásból adódó hátrányokat, de ha az is 25-30%-os teljesítménycsökkenéssel jár majd, akkor már értjük, hogy egyelőre miért nem erőlteti az nVidia, hiába lenne valószínűleg messze a legjobb utófeldolgozós élsimítás a piacon.
Miért jó nekünk a DLSS?
Ezek a játékok fogják a jövőben támogatni a DLSS-t
Atomic Heart
Dauntless
Darksiders III
Deliver Us The Moon: Fortuna
Fear The Wolves
Final Fantasy XV: Windows Edition
Fractured Lands
Hellblade: Senua’s Sacrifice
Hitman 2
Islands of Nyne
Justice
JX3
KINETIK
Mechwarrior 5: Mercenaries
Outpost Zero
Overkill’s The Walking Dead
PlayerUnknown’s Battlegrounds.
Remnant: From The Ashes
SCUM
Serious Sam 4: Planet Badass
Shadow of the Tomb Raider
Stormdivers
The Forge Arena
We Happy Few
PC-s körökben kifejezetten kényes téma tud lenni a felbontással való játék. Emlékszem, amikor először írtunk a PlayStation 4 Pro sakktáblás renderelési módszeréről, ami ugyanígy kisebb felbontású képből állítja elő a végleges 4K-s képet, sokan mondták azt, hogy ez „kamu 4K”, és természetesen igazuk is volt, de a Sonynak játszania kellett az erőforrásokkal, és ezt választották, mint arany középutat. Ergo ez egy megoldás volt egy problémára. Ahogy igazából a DLSS is az. (Ettől függetlenül a kisördög a vállamon nagyon kíváncsi arra, hogy akik anno fújoltak, most is ezt fogják-e tenni.)
Hogy milyen problémáról beszélek, amikor itt vannak az új kártyák és bivalyerősek? Nos, az a helyzet, hogy nem elég erősek. Távolról sem, legalábbis ha a 60 fps a cél, 4K-s felbontás és magas beállítások mellett. A Final Fantasy XV benchmarkban még egy RTX 2080 Ti is csak DLSS használatával tudja elérni a 60 fps-t, egyébként olyan 45 környékén mászkál, és sok játékban csak alulról nyaldossa a 60-at, ha egyáltalán (tesztünk hamarosan, az RTX 2080 eredményei pedig itt találhatóak).
És akkor még nem beszéltünk egy iszonyat erőforrás-igényes, kártyagyilkos funkcióról: a sugárkövetésről. Hamarosan befutnak az első játékok (vagy a Tomb Raider esetében patch-ek), amik képesek ugrani egyet képminőségben a Ray Tracingnek hála, de még ha sikerül is csiszolni a teljesítményen, valószínűleg igazi fps gyilkosok lesznek, 4K-ban pedig közel esélytelennek tűnik a használatuk (a GamesComos Tomb Raider demó 1080p-ben futott, és bár tény, hogy még nagyon összetákolt volt, de a felmutatott sebessége gyászos volt, 30-60 fps között mozgott egy 2080 Ti-vel). A DLSS tehát segíthet a kezdeti időszakban, hogy szebb (használhatóbb?) legyen az eredmény, bár kérdéses, hogy a kártyák hogy fogják bírni sávszélességgel a hagyományos renderelést, kiegészülve a sugárkövetéssel és a DLSS-sel. Konkrét játékok nélkül egyelőre nehéz bármit is mondani, de a Windows 10 októberi frissítése, ami a szükséges DirectX verziót hozza már befutott, és driverek is vannak, tehát már „csak” a játékokra várunk.
Remélhetőleg a megjelenésükkel sok kérdésre megkapjuk a választ. Minket érdekelt például, hogy a DLSS működni fog-e kisebb felbontásokon is, vagy hogy állítható lesz-e a kiinduló felbontás, de a kapcsolatunk kibújt a válasz alól, úgyhogy egyelőre sok a kérdőjel. De remélhetőleg már nem sokáig.