Shop menü

HÁROM GEFORCE RTX 40-ES SOROZATÚ VIDEOKÁRTYA, ÚJ TECHNOLÓGIÁK ÉS FELÚJÍTOTT JÁTÉKOK AZ NVIDIA ELŐADÁSÁN

A GeForce Beyond izgalmasra sikeredett, igaz, az új videokártyákkal kapcsolatban eléggé szűkszavúnak bizonyult a vállalat, de azért így is sok dologra fény derült, ha nem is mindenre.
Víg Ferenc (J.o.k.e.r)
Víg Ferenc (J.o.k.e.r)
Három GeForce RTX 40-es sorozatú videokártya, új technológiák és felújított játékok az Nvidia előadásán

A Nvidia az előzetes tippeknek megfelelően valóban bemutatta a GeForce RTX 40-es sorozat első három tagját a GTC 2022 alkalmával megtartott GeForce Beyond előadáson, ami az új videokártyák mellett számos egyéb témával is foglalkozott, például mesterséges intelligenciával, robotikával, önvezető autókkal, illetve egyebekkel. Ebben az összefoglalóban most a gamereket célzó Ada Lovelace architektúrára, illetve a köré épített videokártyákra koncentrálunk, valamint azokra az új technológiákra is, amelyek a friss termékek óriási gyorsulását adják.

A harmadik RTX generáció valóban az Ada Lovelace architektúra köré épül

Galéria megnyitása

Rengeteg pletyka érkezett már ezzel kapcsolatban, legutóbb pedig maga az Nvidia erősítette meg az új architektúra elnevezését az ízelítő videójában, amely számos utalást tartalmazott a mai GeForce RTX 40 rajtra. Az új sorozat első három tagja valóban bemutatkozott, köztük a csúcskategóriás AD102-es GPU-t tartalmazó GeForce RTX 4090 is. Ez a GPU a TSMC és az Nvidia együttműködésének köszönhetően egy teljesen új, az adott igényekhez optimalizált gyártástechnológiát, a TSMC 4N node-ját használja, ami az 5 nm-es osztályú N5 csíkszélesség továbbfejlesztett változatának tekinthető.

A csúcskategóriás Ada Lovelace GPU

A 4N csíkszélességgel készített Ada Lovelace GPU az Nvidia hivatalos bejelentése szerint 76 milliárd tranzisztort tartalmaz, ami igen komoly előrelépés az aktuális generációhoz képest, hiszen az Ampere alapú GA102-es grafikus processzor még „csak” 28,3 milliárd tranzisztorral rendelkezett – és a Samsung 8 nm-es gyártástechnológiájával készült.

Azt sajnos nem árulta el a vállalat, pontosan mekkora lesz ez a GPU, már ami a kiterjedését illeti, de az eddigi pletykák és információmorzsák alapján 629 négyzetmilliméterre számítunk, azaz 1 négyzetmilliméterrel lehet nagyobb, mint az aktuális GA102, ami egyebek mellett a GeForce RTX 3090 és a GeForce RTX 3090 Ti alapját is adja. Ez a GPU több, mint 18000 CUDA magot tartalmaz – alighanem a teljes értékű termékről van szó –. vagyis az Ampere generáció megfelelő tagjához képest 70%-os növekményt láthatunk ezen a téren.

Galéria megnyitása

Az Ada Lovelace GPU egy teljesen új SM tömböt kapott, ami ezúttal 90 TFLOP/s feletti számítási teljesítményre képes, azaz több mint kétszer gyorsabb az előző generáció azonos osztályú tagjánál – ez az érték megint csak a teljes értékű AD102-es GPU-ra vonatkozhat. A shader-műveletek optimalizációjáról egy újítás dolgozik, ami a Shader Execution Reordering (SER) nevet viseli, ez az Nvidia vezetője szerint akkora áttörés a GPU piacon, mint anno az out-of-order modell volt a CPU piacon.

A SER gyakorlatilag valós időben ütemezi újra a shader-műveleteket a még hatékonyabb erőforrás-kihasználás érdekében, ez pedig 2x-es vagy 3x-os mértékű gyorsulást hozhat a Ray-Tracing műveletek esetében, valamint akár 25%-os gyorsulást hozhat a játékok alatt, legalábbis Jen-Hsun Huang ezt állította.

Galéria megnyitása

Az új architektúra részét képezik még a frissített, harmadik generációt képviselő RT mag is, ami két új hardveres egységgel bővült a nagyobb teljesítmény érdekében: az egyik az Opacity MicroMap Engine, a másik pedig a MicroMesh Engine. Az RT teljesítmény csúcsa 200 TFLOP/s az Nvidia diája szerint, a Ray-Triangle Intersection teljesítmény pedig duplájára nőtt. A GPU megkapta a negyedik generációs Tensor magokat is, amelyek immár 1400 TLOP/s-os csúcsteljesítményre képesek FP16-os műveleteknél, de FP8 esetén már akár 4000 TFLOP/s-os teljesítmény elérésére is képesek.

A GeForce RTX 40-es család első három tagja

A csúcsot kétségkívül a GeForce RTX 4090 képviseli, legalábbis egyelőre, amíg meg nem érkezik egy esetleges GeForce RTX 4090 Ti kiadás. Ez a modell az AD102-es GPU köré épül, ám az Nvidia egyelőre nem árulta el, pontosan milyen felépítésre számíthatunk az újdonság esetében, csak annyit közöltek, hogy a termék 24 GB-nyi GDDR6X fedélzeti memóriát kap, teljesítménye pedig bizonyos játékok alatt 2x-4x nagyobb lesz, mint az aktuális Nvidia csúcsmodellé, a GeForce RTX 3090 Ti-é. A 2x-es érték a raszterizált játékokra vonatkozik, míg a 4x-es a Ray-Tracing támogatást is használó címekre.

A részletesebb jellemzés alkalmával azt is elhangzott, hogy a Microsoft Flight Simulator alatt a GeForce RTX 4090 teljesítménye 2x nagyobb, mint a GeForce RTX 3090 Ti-é, míg a Portal RTX változata alatt már háromszoros, a Racer X játék alatt pedig immár négyszeres a különbség a két modell között.

Energiahatékonyság terén beszédes adat, hogy az Ada Lovelace alapú csúcskártya azonos fogyasztás mellett több mint kétszeres teljesítménynövekedést kínál, és a jelek szerint tuningpotenciálban sem lehet rossz, ugyanis az Nvidia vezetője szerint laborkörülmények között 3 GHz feletti GPU órajelet is sikerült elérni. Ez a videokártya várhatóan 1599 dolláros MSRP-vel rendelkezik majd, megjelenésére pedig 2022. október 12-én számíthatunk.

Galéria megnyitása

A GeForce RTX 4090 alá rögtön két modell is érkezik, amelyek mindketten a GeForce RTX 4080-as sorozatot erősítik, ahogy a pletykák alapján már sejthettük. A két videokártya közül az egyik 16 GB-nyi, a másik pedig 12 GB-nyi GDDR6X fedélzeti memóriát tartalmaz, arról viszont nem esett szó, hogy konkrétan milyen GPU köré épül a termék.

Galéria megnyitása

A következő szekcióban ezt is pedzegetjük egy kicsit, mert vannak már pletykák. A hivatalos adatok szerint a GeForce RTX 4080 2x-4x gyorsabb lesz, mint a GeForce RTX 3080 Ti, a Racer X alatt pedig 3x-os teljesítménykülönbség mutatkozhat a GeForce RTX 4080 javára. A GeForce RTX 4080-as sorozat várhatóan novemberben jelenik meg kereskedelmi forgalomban. A 12 GB-os kiadás listaára 899 dollár lesz, míg a 16 GB-os verzió 1199 dollárról indul.

A GeForce RTX 30-as és a GeForce RTX 40-es sorozat tagjai egy ideig egyszerre lesznek jelen a piacon, ugyanis az alsóbb szintekre majd csak később érkezhetnek GeForce RTX 40-es sorozatú megoldások, addig a 329 dollárról induló GeForce RTX 3060, a GeForce RTX 3070 és a GeForce RTX 3080 adhatja majd a közép- és felsőközép kategória gerincét.

Mit pletykálnak a videokártyák várható paramétereivel kapcsolatban?

A VideoCardz munkatársai az iparági pletykák alapján már sejtenek ezt-azt a friss termékek specifikációiról, igaz, mivel ezek még nem nyertek megerősítést hivatalos forrásból, érdemes őket gyanakvással fogadni. A fentebb említett GeForce RTX 4090 várhatóan egy korlátozott AD102-es GPU-t kaphat, ami igazából nem meglepő, hiszen a teljes értékű, minden erőforrást használni tudó GPU-k csak később szoktak megjelenni, amikor a kihozatali arány javulását követően sikerül felhalmozni elegendő mennyiséget belőlük.

Noha az AD102-es GPU várhatóan 18000-nél is több CUDA magot tartalmaz, a GeForce RTX 4090 fedélzetére kerülő AD102-300-as modell „csak” 16384 aktív CUDA maggal rendelkezhet, a boost órajel pedig 2520 MHz-ig emelkedhet, ami 82,6 TFLOP/s-os számítási teljesítményt eredményezhet. Utóbbi 2,3x több, mint amit a GeForce RTX 3090 nyújtott, azaz elég masszív az előrelépés. GPU-hoz várhatóan 384-bites adatsínen keresztül kapcsolódhat a 24 GB-nyi 21 GHz-es GDDR6X fedélzeti memória, így a memória-sávszélesség 1008 GB/s lehet. TGP terén 450 W-ra lehet számítani, a maximális TGP pedig 660 W-nál tetőzhet.

Galéria megnyitása

A GeForce RTX 4080-as sorozat tagjai a jelek szerint két eltérő GPU-t kapnak, azaz nem csak a fedélzeti memória kapacitásában különbözhetnek. A 16 GB-os verzió esetében most úgy néz ki, az AD103-300-as GPU 9728 CUDA magot vonultathat fel, a boost órajel 2505 MHz lesz, a 22,5 GHz-es GDDR6X VRAM pedig 256-bites adatsínen kapcsolódhat a GPU-hoz, így 720 GB/s-os memória-sávszélességet oszthat be. A TGP itt 320 W lehet, míg a maximális TGP értéke 516 W-on tetőzhet.

A kisebbik GeForce RTX 4080-as videokártya, amiről azt lehetett hinni első körben, hogy egy GeForce RTX 4070-es modellről van szó, 12 GB-nyi GDDR6X fedélzeti memóriával érkezik, és egy AD104-400 kódnévre keresztelt GPU-t kaphat, ha pontosak az értesülések. Ez 7680 CUDA maggal és 2610 MHz-es boost órajellel gazdálkodhat, a 192-bites memória-adatsínre kapcsolódó VRAM pedig 21 GHz-es effektív órajelen ketyeghet, így 504 GB/s-os memória-sávszélességre lehet kilátás. A TGP ebben az esetben már csak 285 W lesz, a maximális TGP pedig 366 W-ig terjedhet.

A jelek szerint egyik videokártya sem kapott NVLink támogatást, valamint az összes modell PCI Express 4.0 x16-os csatolófelületet használhat.

Itt az új DLSS is, ami a DLSS 3.0 verziószámot viseli

Galéria megnyitása

A legújabb kiadás immár nemcsak pixelek generálására képes, hanem teljes képkockákat is létre tud hozni, hála az újításoknak, és közben a grafikus futószalagot sem veszi igénybe, ami igen nagy gyorsulást eredményez: akár négyszer gyorsabb lehet a DLSS 3.0-s teljesítmény, mint a normál renderelés mellett elérhető. Ez utóbbi nyilván a legjobb eshetőségeket takarja, de nagy átlagban is jókora gyorsulás jelei körvonalazódnak. A GPU- és CPU-limites játékok esetében különösen jól jön majd az újdonság, ezeknél ugyanis látványos gyorsulást hozhat.

A demó alkalmával megmutatták, hogy a CyberPunk 2077 milyen teljesítménnyel fut normál renderelés mellett (23-24 FPS), illetve mire képes DLSS és RTX mellett (96-98 FPS). Ennél a játéknál az Nvidia szerint 635 RT művelet zajlik picelenként, ami 16x-os előrelépés az első generációs RT-hez képest, ahogy az a fenti diagramon is látszik. Ez nagyrészt a mesterséges intelligenciának köszönhető – a rendszer egyes pixeleket számol, a többségüket azonban predikció alapján állít elő, a különböző képkockák elemzésével. A demó alkalmával a CPU-limites Microsoft Flight Simulator is előkerült.

Galéria megnyitása

A játékmenetről készített videók bámulatosak voltak, és a jelek szerint a teljesítmény is szépen gyorsult a DLSS 3.0 mellett: a normál 53-54 FPS körüli szint a DLSS és az RTX bekapcsolása mellett 110 FPS körüli szintre emelkedett, ami impresszív eredmény. Egy másik nézetben 65 FPS-ről 133 FPS-re nőtt a teljesítmény, míg egy harmadikban 57 FPS körüli szintről 116 FPS körüli szintre gyorsult a játék, ugyanolyan összehasonlítás mellett.

A DLSS 3 gyakorlatilag négy féle bemeneti adatot dolgoz fel működése során. Egyrészt vizsgálja a jelenlegi és az előző képkockákat, valamint a továbbfejlesztett Optical Flow Accelerator által generált optikai áramlási mezőt, illetve a játék motorja által biztosított mélységgel és mozgásvektorokkal kapcsolatos adatokat is összegzi. Az Optical Flow Accelerator két egymást követő játék-képkockát dolgoz fel, ezek alapján alkot egy optikai áramlási mezőt, amelyen látszik, honnan hová mozognak a pixelek az első képkockától a másodikra váltva, mutatva a mozgás irányát és sebességét.

Galéria megnyitása

Az Optical Flow Accelerator képes pixelszintű információk rögzítésére is, például részecskékére, visszaverődésekére, árnyékokéra, illetve világításéra is, amelyeket nem tartalmaznak a játékmotor mozgásvektor-számításai. Az Optical Flow Accelerator a fenti példában egy motoros mozgását követi, ahol a motoros árnyéka nagyrészt azonos pozícióban foglal helyet a motorhoz képest.

A DLSS 3.0 a játékmotor mozgás-vektorait használva a játékban lévő geometria mozgását is pontosan követi, ám az árnyékét nem. Ha csak a mozgásvektorokat venni figyelembe, az az Nvidia szerint különböző vizuális anomáliákat okozna, például szaggatna az árnyék.

Galéria megnyitása

A DLSS Frame Generation AI hálózat minden egyes pixel esetében eldönti, hogyan használja fel a játék mozgás-vektorait, az optikai áramlási mezőt, illetve az egymást követő képkockákat, hogy köztes képkockákat hozzon létre. Mivel a mozgás pontos követéséhez a játékmotor mozgás-vektorait és az optikai áramlási mezőt is felhasználja, a hálózat pontosan tudja rekonstruálni mind a geometriát, mind pedig az effekteket. Azt azért érdekes lesz látni az előzetes tesztekből, vannak-e gyengeségei az újításnak.

Az Nvidia bejelentése szerint a DLSS 3.0 technológiát hamarosan több, mint 35 játék támogatja majd, ami nem tűnik soknak ahhoz képest, hogy a DLSS 2.0 esetében 216 támogatott játék szerepelt a repertoárban, de valahonnan el kell indulni, ez pedig egy szép kezdésnek ígérkezik:

  • A Plague Tale: Requiem
  • Atomic Heart
  • Black Myth: Wukong
  • Bright Memory: Infinite
  • Chernobylite
  • Conqueror’s Blade
  • Cyberpunk 2077
  • Dakar Rally
  • Deliver Us Mars
  • Destroy All Humans! 2 – Reprobed
  • Dying Light 2 Stay Human
  • F1Ⓡ 22
  • F.I.S.T.: Forged In Shadow Torch
  • Frostbite Engine
  • HITMAN 3
  • Hogwarts Legacy
  • ICARUS
  • Jurassic World Evolution 2
  • Justice
  • Loopmancer
  • Marauders
  • Microsoft Flight Simulator
  • Midnight Ghost Hunt
  • Mount & Blade II: Bannerlord
  • Naraka: Bladepoint
  • NVIDIA Omniverse
  • NVIDIA Racer RTX
  • PERISH
  • Portal with RTX
  • Ripout
  • S.T.A.L.K.E.R. 2: Heart of Chornobyl
  • Scathe
  • Sword and Fairy 7
  • SYNCED
  • The Lord of the Rings: Gollum
  • The Witcher 3: Wild Hunt
  • THRONE AND LIBERTY
  • Tower of Fantasy
  • Unity
  • Unreal Engine 4 & 5
  • Warhammer 40,000: Darktide

Már nem kell sokat várni az új videokártyákra

Galéria megnyitása

Első körben tehát az 1599 dolláros GeForce RTX 4090 jelenik meg 2022. október 12-én, vagyis hamarosan megtudjuk, mire képes az új csúcskártya az első független tesztekben felmutatott eredmények alapján. A GeForce RTX 4080-as sorozat két tagja november folyamán teszi tiszteletét a piacon, amelyek közül a 16 GB-os verzió 1199 dollárba, a 12 GB-os pedig 899 dollárba kerül majd.

Az előadás visszanézhető az alábbiakban

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére