Az Intel megtartotta korábban beharangozott előadását, amelynek keretén belül bemutatkoztak a mobil videokártyák, ám a rajt egyelőre még csak formális. Első körben a belépőszintet célzó modellek kerülnek forgalomba, a közép- és felsőkategóriába szánt verziókra nyár elejéig kell várni. És várhatóan ebben az időszakban debütálhatnak majd az asztali videokártyák is, amelyek iránt igen nagy az érdeklődés. Utánuk pedig a mobil munkaállomásokba szánt megoldásokról is lehullhat a lepel. Nézzük mi mindenről esett szó az előadás alkalmával!
Két GPU adja az alapokat, legalábbis egyelőre
Mindenek előtt feltétlenül fontos megjegyezni, hogy az Intel az „EU” (Execution Unit) kifejezés helyett most már előszeretettel használja az XVE kifejezést (Xe Vector Engine), ami természetesen nem véletlen. Valószínűleg az új elnevezéssel akarnak eltávolodni az iGPU korszaktól, és igazából jogos is, hiszen ezek a végrehajtó egységek már teljesen más szintet képviselnek, mint az iGPU frontról ismert EU-k.
Egyetlen Xe mag összesen 16 darab XVE-t tartalmaz, valamint ezek mellé 16 darab XMX mátrix motor is kerül, amelyek a mesterséges intelligenciával kapcsolatos munkafolyamatokat is gyorsítják. Számítási teljesítmény tekintetében egy XVE vektormotor egyetlen órajel alatt 64 darab INT8, 32 darab FP16, vagy 16 darab FP32 számítás elvégzésére képes, míg az XMX mátrix motorok esetében egy órajel alatt 512 INT4/INT2, 256 INT8, illetve 128 FP16/BF16 művelet elvégzésére van mód.
A fentiek után első körben érdemes tisztázni, mobil fronton milyen felépítéssel rendelkező grafikus processzorokra számíthatunk, így könnyebb lesz eligazodni a kínálatban is. Alapjában véve az ACM-G10-es és az ACM-G11-es grafikus processzor érkezik, amelyek között igen komoly különbség van, már ami a „tűzerőt” illeti. A belépőszintű ACM-G11 esetében csak 8 darab Xe mag áll rendelkezésre, ami igazából 128 XVE jelenlétét eredményezi, hiszen egy ilyen Xe magban 16 XVE vektor motor foglal helyet.
Az ACM-G11 kapott továbbá 8 RT egységet, 4 MB-nyi másodszintű gyorsítótárat, valamint 96-bites memória-adatsínt is, a GPU pedig x8-os PCI Express sávszélességen keresztül kommunikálhat. Ezzel szemben az ACM-G10 már sokkal komolyabb teljesítményre képes, hiszen négyszer több XVE egység, négyszer több RT egység, valamint négyszer több L2 Cache található a fedélzetén, ahogy a fenti dián is látszik, a memória-adatsín pedig 256-bites lesz. Mindkét GPU két darab Xe Media Engine-t, illetve négy kijelző-vezérlőt kapott, ezek képességeire később még kitérünk.
A fentiek fényében a maximális számítási teljesítmény az ACM-G11 esetében várhatóan picivel 3 TFLOP/s felett lehet FP32-es műveletek esetén, míg az FP16-os érték 25 TFLOP/s körül helyezkedhet el, ha abból indulunk ki, hogy a GPU boost órajele 1,55 GHz-en tetőzik. Ehhez képest az ACM-G10 már eleve négyszer nagyobb teljesítményre lesz képes, ráadásul a maximális órajel itt 1,65 GHz lesz: ennél a verziónál 13,5 TFLOP/s-os FP32-es és 108 TFLOP/s-os FP16-os teljesítményre van kilátás. Mivel azonban mobil verziókról van szó, a tényleges teljesítményt majd az adott notebookgyártó implementációja dönti el – jó eséllyel itt is lehet majd némi szórás órajelek terén, természetesen attól függően, a formátum és a hűtés milyen teljesítményt enged meg. Utóbbi persze csak feltételezés, a lenti táblázatban ugyanis csak konkrét órajelek szerepelnek, nem órajel-tartományok.
Nézzük a videokártyákat!
A kisebbik GPU, vagyis az ACM-G11 adja az áprilisban megjelenő első mobil videokártyák alapját, vagyis az A-sorozatú ARC 3 A350M és az ARC 3 A370M egyaránt köré épül. A két modell sajnos nem használhatja ki a GPU teljes, 96-bites memória-adatsínjét, csak 64-bites memóriasínnel kell beérniük, amire 4 GB-nyi VRAM kapcsolódik. A GPU-órajelek között természetesen lesz eltérés, méghozzá elég nagy, 400 MHz-es, ennek megfelelően a megcélzott TDP tartomány is merőben más lesz: az A350M a 25-35 W közötti, az A370M pedig a 35-50 W közötti szintet szolgálja ki.
Ha már a többi modell is szerepel a táblázatban, érdemes róluk is említést tenni. Az A350M és az A370M fölé, amelyek között 30-35% közötti teljesítménykülönbség lesz, érkezik egy A550M típusú verzió is, ami érdekes módon igen alacsony, mindössze 900 MHz-es órajelen ketyeg majd. Az elméleti maximális számítási teljesítménye egyszeres pontosságú műveletek esetén 3,7 TFLOP/s körül helyezkedhet el, vagyis csak alig lesz gyorsabb az A370M-nél, hiába kap kétszer több magot, memóriát és memória-sávszélességet. Ez a modell a 60-80 W közötti szinten kap helyet és a nagyobbik GPU-t használja.
A teljesítmény szegmensbe érkezik az ARC A730M és az ARC 770M, amelyek között szintén elég nagy lesz a szakadék, már ami az elméleti maximális számítási teljesítményt illeti. Előbbinél a 24, míg utóbbinál 32 Xe motor áll rendelkezésre, ami sorrendben 384 és 512 XVE egységet jelent, az órajelek között pedig 550 MHz-es különbség lesz. Az ARC A730M a 80-120 W-os szintre érkezik, méghozzá 192-bites memória-adatsínnel és 12 GB-nyi fedélzeti memóriával. Ehhez képest az A770M már 256-bites memória-adatsínt és 16 GB-nyi fedélzeti memóriát kap, a TDP tartomány azonban 120 és 150 W között helyezkedhet el.
Az új mobil videokártyák közé idővel újabb modellek is érkezhetnek, ugyanis tényleg elég nagynak tűnnek a szakadékok a teljesítmények között, igaz, ez egyelőre csak a papírforma, a végső verdiktet majd csak az első független tesztek alapján lehet kimondani. Az A350M és az A370M érkezik először, már április folyamán, a többi változatra azonban nyár elejéig kell várni. Azért már rendelkezésre állnak belsős mérések is, ám ezeket egyelőre érdemes távolságtartóan fogadni.
Hogyan alakul a teljesítmény?
Az Arc A370M várhatóan érezhető előrelépést hoz a 96 EU-val ellátott Intel Xe iGPU-hoz képest, ami az összehasonlítás alkalmával egy Core i7-1280P processzorban kapott helyet. Ezt egy Core i7-12700H processzorral és egy A370M videokártyával szerelt rendszerhez mérték, az eredmények magukért beszélnek. 1080p-s felbontás és közepes vagy magas minőségbeállítás alkalmával 60 FPS feletti átlag FPS látszik a tesztelt játékoknál, az eSport címek alatt azonban a 90 FPS körüli átlag is elérhető – és ez még csak a belépőszint.
Ezzel a teljesítménnyel az Arc 3 A370M alighanem az olyan megoldások ellen versenyezhet, mint például a GeForce MX350 vagy az MX450, illetve talán az MX550-es és az MX570-es modellekkel is képes lehet felvenni a versenyt, az azonban kérdéses, hogy a belépőszintű Nvidia és AMD videokártyák ellen mire lesz képes – idővel mindenképpen kiderül.
Az új grafikus processzorok egyébként rendelkeznek Sampler Feedback, Mesh Shading, Variable Rate Shading és Ray Tracing támogatással, azaz teljesítik a DirectX XII Ultimate követelményeit.
Van még más is, amiről érdemes szót ejteni
Ahogy fentebb említettük, mindkét új GPU négy futószalagos kijelző-vezérlő motort kap, amely az Xe Display Engine nevet viseli. Szabványok terén érdekes módon „csak” HDMI 2.0b támogatásról tesz említést az Intel, miközben az AMD és az Nvidia háza táján már vannak HDMI 2.1 támogatással felvértezett videokártyák is. Ezen felül DisplayPort 1.4a kimenetek kezelésére is képes az egység, valamint DisplayPort 2.010G támogatásról is szó esik. Utóbbi igazából eléggé zárójeles történet, hiszen DisplayPort 2.0-s támogatással ellátott monitor egyelőre nem kapható, így kérdéses milyen lesz a „DisplayPort 2.010G Ready” támogatás, lesznek-e később hiányosságai a ténylegesen DisplayPort 2.0 támogatással ellátott megoldásokhoz képest.
A kijelző-motorhoz természetesen a dinamikusan váltakozó képfrissítési ráta is jár az Adaptive Sync formájában, valamint két extra funkció is debütál, amelyek a Speed Sync és a Smooth Sync nevet viselik. Előbbi, vagyis a Speed Sync igazából egy virtualizált renderelő bufferrel dolgozik, ami valamilyen szinten rugalmas, már ami az FPS értékeket illeti, a célja pedig az, hogy a képtörést a továbbított képkockák szinkronizálásával előzze meg – ez igazából alacsony késleltetésű, képtörés-mentes játékélményt kínál, még a fix képfrissítési rátájú monitor köré épülő rendszerek esetében is.
A másik, azaz a Smooth Sync már akkor jön képbe, ha a felhasználó ki akarja kapcsolni a V-Sync funkciót a reszponzivitás növelésének érdekében, de ezzel együtt a képtörést is szeretné mérsékelni: a Smooth Sync a képtöréseket dithering filter segítségével kezeli, így azok kevésbé észrevehetőek. Ez összességében jól hangzik és érdekesnek tűnik, de majd csak a gyakorlatban derül ki mennyire hatékony a két újítás.
A kijelző-vezérlő motorok után az Xe Media Engine is érdemel néhány szót, ugyanis igencsak ütőképes megoldásról van szó, ráadásul ez az iparág első olyan terméke, amely képes az AV1 videók kódolását is gyorsítani, nem csak a dekódolást. Ilyen motorból kettő van minden GPU fedélzetén, lényegében ugyanazt nyújtják a teljes termékpaletta esetében.
A két Xe Media Engine segítségével akár 12-bites 8k60-as HDR tartalmak dekódolására, valamint akár 10-bites 8k60 HDR tartalmak kódolására is van lehetőség, ami nem hangzik rosszul. Ezzel együtt jár még hardveres gyorsítás a H.264-es, a H.265-ös, illetve a VP9-es tartalmakhoz is. Az AV1 egyébként azért is ígéretes, mert a H.264 képminőségét feleakkora sávszélesség-felhasználás mellett hozza, azonos sávszélesség mellett pedig jobb képminőséget kínál. Az AV1 még a H.265-höz képest is takarékosabban bánik a sávszélességgel: az előny 20% körüli. Az AV1 kódolással kapcsolatban azt is megemlítette az Intel, hogy a szoftveres megoldásokhoz képest az ARC sorozatban használt hardveres gyorsítási módszer akár 50x-es gyorsulást is hozhat. Ezt az FFMPEG, a Handbrage, a DaVinci Resolve Studio, az XSplit és az Adobe Premiere Pro felhasználói egyaránt élvezhetik majd, ha az új videokártyákkal szerelt konfigurációkkal dolgoznak.
Ide kapcsolódnak még az XMX mátrix motorok is, amelyekkel jelentősen javítható a videók képminősége, ráadásul igen gyorsan. A bemutató alapján az Arc mobil videokártyán futó Topaz Labs Video Enhance AI több, mint kétszer gyorsabb, mint a Tiger Lake sorozat Xe-LP alapú iGPU-ja. És ez a különbség tovább növelhető, hála a Hyper Encode technológiának, ugyanis azon keresztül mind a dGPU, mind pedig az iGPU ugyanazon a feladaton dolgozhat, egymással hatékonyan együttműködve, így a sebesség közel háromszorosára is ugorhat az említett egységhez képest – amúgy a gyorsulás mértéke 60% a tisztán dGPU alapú üzemmódhoz képest.
A Hyper Encode része a DeepLink ökoszisztémának, ami egyébként Dynamic Power Share és Hyper Compute funkciót is rejt. A Dynamic Power Share a terhelésformától függően osztja el a rendelkezésre álló teljesítményt, így a dGPU vagy a CPU magasabb kerettel gazdálkodhat, ami extra teljesítményt hoz a konyhára – a gyorsulás mértéke akár 30% is lehet. A Hyper Compute keretén belül az összes rendelkezésre álló AI gyorsítót és számítási egységet fel lehet használni az adott feladat gyorsítására, így akár 24%-os teljesítménynövekedés is elérhető.
Az XMX-ben rejlő lehetőségeket egyébként Adobe Premiere Pro alatt is kamatoztathatjuk, valamint az XeSS technológia is profitálhat belőle – utóbbival kapcsolatban éppen a GDC 2022 alkalmával árult el újabb részleteket a gyártó. Az XeSS egyébként nyár elején debütál és több játék is támogatja majd, méghozzá az alábbiak:
Az új hardverhez új driver is dukál
Az Intel ízelítőt adott az ARC sorozatú videokártyákhoz érkező driverrel kapcsolatban is, ami a kép alapján teljesen új felhasználói kezelőfelülettel rendelkezik és lényegében mindent egy helyre csoportosít, amire csak szükség lehet. A kínálat részét képezi a Creator Studio, de lesznek globális beállítási lehetőségek, megtekinthetjük a játékkönyvtárunkat, tuningolhatunk, valamint friss driver beszerzésére is lesz mód – a hírek szerint a drivert automatikusan le is töltheti a szoftver és a frissítést is elvégezheti automatikusan.
Jönnek az Intel EVO dizájn köré épülő modellek is
Az Intel partnerei természetesen készítenek majd olyan notebookokat, amelyek megfelelnek az Intel EVO szabvány követelményeinek, miközben iGPU mellett már dGPU-t is alkalmaznak, az összes fentebb említett előnnyel karöltve. Az egyik első ilyen konfiguráció a Samsung Galaxy Book2 Pro lesz, amivel kapcsolatban korábban már kiszivárgott ez-az.
ARC 3-as sorozatú mobil videokártyával ellátott notebookot a többi partner is bemutat, ezek között a jelek szerint konvertibilis noteszgépek is lesznek, amelyek alighanem érintőkijelzővel büszkélkednek.
Érkeznek az első Intel ARC videokártyával szerelt noteszgépek
Az első hullám, amelynek részeként A350M és A370M alapú modellek debütálhatnak, már április folyamán megérkezhet, a „combosabb” mobil videokártyákra azonban sajnos nyár elejéig kell várni. Az Intel szerint az ARC 3 sorozatú videokártyával ellátott notebookok esetében 899 dollárról indul majd a listaár.