Eljött a várva várt BIG NAVI bemutató, amelynek során rengeteg érdekességről esett szó, azt is megtudhattunk nagy vonalakban, mennyire lesznek gyorsak az új videokártyák a konkurens megoldásokhoz képest. Az RDNA2-vel kapcsolatos újításokról is szó esett, igaz, egyelőre csak madártávlatból engedett betekintést az AMD.
A ZEN3 rajt alkalmával, amikor a RYZEN 5000-es sorozatú processzorok bemutatkoztak, a show végére még tartogatott egy kis meglepetést Dr. Lisa Su, az AMD vezetője: megmutatta, milyen teljesítményre képes a BIG NAVI sorozat egyik tagja bizonyos játékok alatt. Az nem derült ki, hogy ez melyik videokártya volt, így aki arra tippelt, hogy a második leggyorsabb modellről lehetett szó, bizony nyert.
A friss show főszereplői a Radeon RX 6000-es sorozatú videokártyák voltak, amelyek első körben hárman kerülnek forgalomba: a Radeon RX 6800, a Radeon RX 6800 XT, illetve a Radeon RX 6900 XT. Mindegyik új modell a NAVI 21-es GPU-t veszi alapul, ám aktív CU tömbök terén már bőven lesz különbség közöttük, a Radeon RX 6800 esetében az órajelek is alacsonyabbak lesznek. A NAVI 21-es lapka fedélzetén összesen 26,8 milliárd tranzisztort találunk, a gyártástechnológia azonban nem változott, ugyanazt a 7 nm-es TSMC csíkszélességet veszi igénybe a GPU, amit az első generációs RDNA modellek is.
Ehhez a GPU-hoz „csak” GDDR6-os fedélzeti memória kapcsolódik, méghozzá „csak” 256-bites memória-adatsínen, ami első ránézésre igencsak karcsúnak tűnik, de jól átgondolt stratégia eredménye, ugyanis a hiányzó memória-sávszélességet a titkos összetevő, az Infinity Cache pótolja majd, ami egy 128 MB-os gyorsítótárként áll a CU tömbök és a VRAM között. Ennek funkciójáról később még említést teszünk, valamint az architektúrával és az energiahatékonysággal is foglalkozunk majd – sok egyéb mellett –, most viszont nem szaporítjuk tovább a szót, megmutatjuk, pontosan hogyan is néz ki az új Radeon generáció első három tagja, már ami a tulajdonságaikat illeti.
Ahogy az a táblázatból kiderül, mind az árazás, mind pedig a specifikációk jónak tűnnek, de a végső ítéltet majd a tesztek után lesz érdemes meghozni. A kínálat csúcsán a Radeon RX 6900 XT csücsül, amelynél a NAVI 21-es GPU mind a 80 CU tömbje elérhető. Az órajelek meglehetősen magasak, ami az energiahatékonysággal kapcsolatos fejlesztéseknek köszönhető – ezen a területen rengeteget tanult a vállalat a ZEN sorozat fejlesztésénél, így ezeket a trükköket és mesterfogásokat vetették be az új GPU esetében.
A GPU a Radeon RX 5700 XT-hez képest több, mint kétszer jobb egyszeres pontosságú számítási teljesítményt nyújt, ami igen impresszíven hangzik – ezen a téren sikerült a duplázás a Radeon RX 5000-es sorozathoz képest, de azért azt se felejtsük el, hogy pontosan kétszer több stream egységgel is rendelkezik. A Radeon RX 6900 XT a maga 16 GB-nyi GDDR6-os fedélzeti memóriájával 999 dolláros áron érkezik, ami versenyképesnek hangzik az 1499 dolláros GeForce RTX 3090-el szemben, még akkor is, ha utóbbinál ott a 24 GB-nyi memória is az egyenletben.
A Radeon RX 6800 XT már elveszít 8 CU tömböt, így csak 72 aktív CU-val dolgozik, az órajelek azonban változatlanok, csak úgy, ahogy a memória-alrendszer is. Természetesen az Infinity Cache itt is rendelkezésre áll. Ebben az esetben a NAVI 21 GPU már csak 18,6 TFLOP/s-os FP32-es számítási teljesítményre képes, de így is majdnem kétszer gyorsabb a Radeon RX 5700 XT-nél, ami azért nagy szó. Ez a videokártya szintén 300 W-os TBP-vel érkezik, ellenfele pedig a GeForce RTX 3080 lesz, így az árat 649 dollárban állapították meg, vagyis 50 dollárral a konkurens megoldás alá mennek. Az újdonság nagyjából a GeForce RTX 3080 szintjét hozza, de erre még külön is kitérünk.
A legkisebb NAVI 21-es videokártya a Radeon RX 6800 lesz, amelynél már csak 60 aktív CU tömbre számíthatunk, a GPU alacsonyabb órajeleken is ketyeg majd, mint a nagyobb testvéreknél. A memória-alrendszer teljes mértékben ugyanaz lesz, mint a másik két kártyánál: 16 GB-nyi 16 GHz-es GDDR6-os lapka kapcsolódik a 256-bites memória-adatsínre, ami 512 GB/s-os memória-sávszélességet eredményez, de az Infinity Cache segít ennek növelésében. A kevesebb GPU erőforrás jóvoltából a TBP keretet is csökkenteni lehetett, így az 300 W helyett már csak 250 W lesz. Teljesítmény terén a GeForce RTX 2080 Ti magasságába várható az új videokártya, azaz a GeForce RTX 3070 méltó ellenfele lesz, de mivel utóbbi még csak most jelenik meg, konkrét méréseket nem tudott végezni az AMD – maradt a GeForce RTX 2080 Ti a referencia.
A fenti videokártyák mindannyian alkalmasak lesznek 4K-s játékra, igaz, a Radeon RX 6800-nál már azért rezeghet a léc az újabb motorokra épülő játékoknál, így ha azok alatt 4K-s felbontást nem is feltétlenül, 1440p-s felbontást magabiztosan kiszolgálhat az újonc.
Az összes fentebb bemutatott Radeon RX 6000-es sorozatú videokártya PCI Express 4.0-s csatolófelületet használ, videó kimeneteik között HDMI 2.1-s, DisplayPort 1.4-es és USB-C port sorakozik. Utóbbi lényegében egy VirtualLink port, amelyen keresztül teljesítmény leadására is van mód. További fontos dolog, hogy az új modellek közül a Radeon RX 6900 XT és a Radeon RX 6800 XT csak 2,5 slotnyi helyet foglal el a házban, míg a Radeon RX 6800 már kétslotos kivitelben érkezik.
Energiahatékonyság és az RDNA2 architektúra
Az AMD korábban, az RDNA1 bejelentésekor azzal büszkélkedett, hogy az előző generációhoz képest 50%-kal sikerült növelni az energiahatékonyságot, ám akkor ebben segítő jobbot nyújtott az új gyártástechnológia is. Ezúttal szintén 50%-os előrelépést ígértek, ám itt már nem történt csíkszélesség-váltás, vagyis ezt az ígéretet az architektúra fejlesztésével kellett teljesíteni.
A jelek szerint ez sikerült is, sőt, még egy pici extrát is rátettek, ugyanis 54% lett a végleges érték. Ennek nagy részét az órajelenként végrehajtható műveletek (IPC) számának növekedése hozta, de ezzel együtt az energiahatékonyság terén is számos fontos változtatást eszközöltek, amelyek sokat hoztak a konyhára. A kirakós utolsó darabja az órajel-emelés volt, így áll össze az 54%-os előny.
A CU tömbök energiahatékonyabbá tételében nagy szerepet játszott az energiamenedzsment fejlesztése: ezúttal sokkal finomabb órajel-szabályzást tesz lehetővé a rendszer, ami segít a felesleges fogyasztás elkerülésében. Átdolgozták az adatsávokat is annak érdekében, hogy minél kevesebb adatok kelljen ide-oda küldözgetni a VRAM és a GPU között, így megint sikerült némi fogyasztást spórolni.
A harmadik lépcső az agresszív futószalag kiegyensúlyozás, ám arról egyelőre nem beszélt a vállalat, hogy ez pontosan mit takar, milyen változások történtek a különböző részegységeknél, így ezekre az információkra november 18-ig még várni kell.
A chipet érintő optimalizációk és változtatások hatására a GPU magórajele ugyanakkora fogyasztás mellett 30%-kal magasabb lehet, ami már önmagában is sokat jelent energiahatékonyság terén. Ebben a munkában hasznosították a ZEN architektúrák fejlesztése során szerzett tapasztalatokat, ezért sikerült teljesíteni az ígért 50%-os előrelépést, sőt, egy picit még túl is szárnyalták.
A rejtélyes Infinity Cache
Korábban már pletykáltak erről a 128 MB-os gyorsítótárról, ami várhatóan a kisebb Radeon RX 5600-as sorozatú videokártyák fedélzetén is helyet kaphat, igaz, nincs kizárva, hogy már kisebb kapacitással rendelkezik, ugyanis nagyon tranzisztor-igényes megoldásról van szó. Az Infinity Cache a jelek szerint tényleg a BIG NAVI titkos összetevője, ami abban segít, hogy bizonyos műveleteket gyorsabban elvégezhessen a GPU anélkül, hogy adatokért kelljen rohangálni a VRAM-hoz, hiszen ezek az adatok a gyorsítótárban várhatják, hogy felhasználják őket.
Az Infinity Cache bizonyos esetekben segíthet az energiahatékonyság növelésében, pont a fentebb említett ok miatt, ugyanakkor a szűk memória-adatsín korlátait is ellensúlyozhatja. Segítségével az AMD 256-bites adatsínt és kevesebb GDDR6-os fedélzeti memóriát használhatott, ami nem csak a költségekre, de az energiahatékonyságra is pozitív hatást gyakorol.
A gyorsítótár az AMD szerint egy 384-bites adatsínnel ellátott megoldáshoz képest 90%-nyi fogyasztással dolgozik, de a csúcs memória-sávszélesség a 384-bites adatsín kétszeresét is meghaladhatja. Nyilván ez csak arra az esetekre érvényes, amikor az Infinity Cache-ben rejlő lehetőségeket képes kiaknázni az adott szoftver vagy alkalmazás. Ez a gyorsítótár segít a GPU teljesítményének növelésében azáltal, hogy elérhetőbb közelségbe hozza a feldolgozásra váró adatokat, ne kelljen értük a VRAM-ig menni; plusz a Ray-Tracing funkciót kezelő magok feladatát is segítheti.
Az Infinity Cache pontos működését és azt, hogy mely helyzetekben milyen előnyöket kínál, egyelőre nem részletezte az AMD, de ez nem is akkora csoda, hiszen ez csak egy gyors bemutató volt, a mélyelemzések majd csak november 18-án láthatják meg a napvilágot – sajnos.
Jön a hardveresen gyorsított Ray-Tracing és SuperSampling is lesz
Az AMD végre ezen a területen is felzárkózik az Nvidia mellé, ugyanis a NAVI 21 GPU esetében minden egyes CU tömb tartalmaz egy dedikált RT magot is, ami a ray-tracing feladatok gyorsításáért felel majd. Azt sajnos nem árulta el a vállalat, hogy ez a funkció milyen teljesítmény mellett érhető el, de a World of Warcraft: Shadows segítségével megmutatták, hogy már működik és használható.
Az RT magok a fentebb részletezett Infinity Cache-re támaszkodva dolgozhatnak majd, ami a ray-tracing feladatokkal kapcsolatos adatmennyiség tárolásával és gyorsan elérhetővé tételével nagyot lendíthet a teljesítményen, így a lassabban hozzáférhető VRAM-ban elvileg kevesebb ilyen témájú adatot kell elhelyezni.
Említés szintjén arról is szó esett, hogy a későbbiekben egy Super Resolution eljárás is érkezik, ez lényegében az Nvidia DLSS AMD-s megfelelője lehet. Részletek egyelőre nem derültek ki vele kapcsolatban, de kíváncsian várjuk, miről is van szó. Csodát természetesen ez sem tesz majd, de azt el lehet érni, hogy nagyobb felbontású monitoron játszhatóbb legyen a tartalom, ugyanis ennél a módszernél az alacsonyabb felbontású tartalmat skálázzák fel, ami kevesebb erőforrást igényel és így jobb FPS értékeket eredményez, mint ha eleve a végleges felbontással renderelné a tartalmakat a GPU. Ez a Super Resolution funkció egyébként az AMD FidelityFX csomagjának részeként érkezik.
Az új videokártyák természetesen DirectX 12 Ultimate, azaz DirectX 12 Feature Level 12_2 támogatással is rendelkeznek, így mindent használhatnak, ami az említett funkciókészletbe beletartozik. Extraként a Microsoft DirectStorage API-ját is kezelni fogják az új Radeonok, csak úgy, ahogy a GeForce RTX 30-as sorozat tagjai is, így a játékok különböző fájljai minimális CPU erőforrás mellett kerülhetnek kitömörítésre, a tömörítéssel kapcsolatos feladatokat pedig teljes mértékben a GPU végezheti, sokkal gyorsabban, mint a korábbi, CPU alapú megoldások. Ehhez persze megfelelő támogatásokra is szükség lesz, de ez már más kérdés.
RYZEN 5000 + Radeon RX 6000 = Jobb teljesítmény
Az AMD egy érdekes funkciót is megvillantott, ami a Smart Access Memory nevet viseli. Itt arról van szó, hogy az 500-as sorozatú lapkakészlettel ellátott alaplapok esetében, ha a RYZEN 5000-es sorozatú processzor mellé Radeon RX 6000-es sorozatú videokártya kerül, a processzor a GPU teljes VRAM területéhez hozzáférhet, ami némi gyorsuláshoz vezethet. Ehhez természetesen a legfrissebb BIOS-ra, illetve a szolgáltatás BIOS-on belüli aktiválására is szükség lesz.
Noha a funkciónak lesz automatikus üzemmódja, az optimális működéshez szükség lesz a játékfejlesztők munkájára is, hogy maximálisan ki lehessen aknázni a benne rejlő lehetőségeket. Hasonló funkció egyébként eddig is elérhető vált a CPU és a PCIe eszközök között, ám eddig rendszerint 256 MB volt a felső limit, amihez a CPU hozzáférhet, ami bekorlátozta kissé a lehetőségeket. A Smart Access Memory funkció néhány százalékos teljesítménynövekedést hozhat, ahogy az a fenti dián is látható, optimalizációtól függően – a későbbiekben akár többet is hozhat a konyhára, ahogy egyre inkább felkészítik a szoftvereket a használatára.
Rage Mode – Automatikus teljesítménynövelés egyetlen kattintással
Az AMD a fenti Smart Access Memory mellett egy Rage Mode névre keresztelt funkciót is bemutatott, amelynek aktiválásával automatikusan beállíthatja a rendszer a legmagasabb stabil GPU órajeleket, ezáltal némi gyorsulásra lehet számítani – és azt sem szabad elfelejteni hogy ezzel egy időben a fogyasztás is növekedésnek indul, jó eséllyel nagyobb mértékben, mint a teljesítmény, de erre a tesztek majd rávilágítanak.
A Rage Mode és a Smart Access Memory együttesen 2-13% közötti gyorsulást hozhat a Radeon RX 6800 XT esetében, azt viszont nem részletezték, mi a helyzet a többi modellel, de a tesztek majd erre is választ fognak adni.
És mi a helyzet a teljesítménnyel?
A belsős mérések alapján papíron egész jónak tűnik, de ezeket a számokat egyelőre érdemes távolságtartóan kezelni, hiszen több helyen is trükkök láthatóak a diagramokon: a nyers teljesítmény helyett a Rage Mode és a Smart Access Memory funkció aktiválásával elérhető teljesítmény látszik, márpedig az 3-14%-kal több lehet, mint amit a GPU ezek nélkül gyárilag tud.
Félreértés ne essék, azért vannak ezek a technológiák, hogy használjuk őket, de a nélkülük elérhető teljesítmény is fontos, ezért kár, hogy az pont lemaradt. Az összehasonlítás éppen ezért nem túl korrekt, hiszen a Smart Memory Access és a Rage Mode sem Intel platform használata, sem GeForce RTX 30-as videokártya használata mellett nem érhető el – többet mutatnának a lényegből azok a számok, amelyek ezen technológiák mellőzésével születnek. Azt kiemelnénk, hogy a Rage Mode természetesen elérhető Intel processzor mellett is, hiszen ott a GPU tuningjáról van szó, de a Smart Memory Access nem. Most aztán tényleg fontosak lesznek a független tesztek eredményei.
Nyilván az is benne lehet a pakliban, hogy a driver fejlesztése még zajlik, azaz a következő hetek folyamán még jöhet némi gyorsulás, azért nem mutattak teljes képet, mindenesetre fura. A lényeg persze úgyis az, hogy a piacra kerülő termékek versenyképesek legyenek mind ár, mind pedig teljesítmény tekintetében, ugyanis nagy szükség van a versenyre a videokártya-piac felső kategóriájában, ahol jó ideje nem akadtak kihívói az Nvidia termékeinek.
A BIG NAVI bemutató összességében kellemes meglepetésként fogható fel, az előzetes számok mindenképpen biztatóak, már csak az a kérdés, hogy a független tesztek is hasonló konklúzióra jutnak-e. Reméljük, igen, mert ideje lenne, ha ismét kapna ütőképes vetélytársat az Nvidia a felső kategóriában is, úgy lehet egészséges a verseny és a piac is.
A teljes előadás az alábbiakban látható: