GM107, Maxwell architektúra
Megérkezett az nVidia első Maxwell architektúrás GPU-ja, a GM107-es, ami a GTX750-es széria alapját képezi. A Maxwell leegyszerűsítve nem más, mint a Kepler továbbfejlesztése, ám a cél ezúttal nem (csak) a minél nagyobb teljesítmény elérése volt, a cég mérnökei óriási figyelmet fordítottak az energiahatékonyságra. Ennek köszönhetően a GM107-es attól függetlenül, hogy a GPU még mindig 28nm-es gyártástechnológiát használ, messze a legjobb teljesítmény/watt mutatóval rendelkezik.
Hogyan éri ezt el? Nos, a mobil chipek fejlesztésének hála, az nVidia mérnökeinek volt honnan ihletet meríteniük. Először is átalakították a shader mag fő építőköveit, az SMX-eket. A Kepler architektúrás GPU-k esetében egy-egy SMX 192 CUDA magot tartalmaz a hozzájuk tartozó vezérlő logikával, textúrázókkal és a polymorph motorral. Viszont mint kiderült, 192 feldolgozó munkáját ütemezni egyetlen, viszonylag egyszerű vezérlővel nem túl hatékony, így a cél elsősorban a kihasználtság növelése volt, hiszen akkor kevesebb CUDA maggal (shaderrel) is lehet hozni ugyanazt a teljesítményt. Éppen ezért az új SMX-et (amit immár SMM-nek hívnak) felosztották négy további részre, amikben 32-32 feldolgozó van, és ezek a blokkok saját vezérlőt kaptak. Mivel az ütemező továbbra is statikus, ezért erősen támaszkodik a driverre, valószínűleg kicsit jobban is, mint a Keplerek. Az új 32 feldolgozós blokkok páronként kaptak négy textúrázót és gyorsítótárakat hozzájuk. Polymorph motorból maradt az egy/SMM felállás (felesleges is lett volna több), és az SMM-ek továbbra is egy GPC-n (Graphics Processing Cluster) belül foglalhatnak helyet. A GM107-ben egyetlen GPC van, ami öt darab SMM-et tartalmaz. Mivel ezekben az eddigi 192 helyett 4*32, tehát 128 CUDA mag van, ezért egy teljes értékű GM107-es 640 CUDA magot tartalmaz.
A memóriavezérlő 2*64 bites, akárcsak a GTX650 Ti esetében. Mivel a memória-sávszélesség könnyen limitáló tényező lehet, ezért a GM107 grafikus vezérlős mércével óriási, 2MB-os másodszintű gyorsítótárat kapott. Még az óriási GK110-esnek sem áll ekkora cache a rendelkezésére (1,5MB), a GK107-esben pedig csak 256Kbyte volt. A nagyobb cache azt jelenti, hogy ritkábban kell a memóriához nyúlni, és ez valamennyire kompenzálhatja a 128 bites memóriavezérlő lemaradását a szélesebb adatbusszal rendelkező társaihoz képest.
Van más változás is a Maxwell tarsolyában, ami nem érinti a 3D-s grafikus feldolgozást, ez pedig az újgenerációs NVENC motor. Az NVENC gondoskodik a videó-folyamok hardveres tömörítéséről, ami elengedhetetlen a Shadowplay használatához. Az új motor 1,5-2x gyorsabb, mint az eddigi, így még kisebb lesz a teljesítmény csökkenés bekapcsolt Shadowplay mellett, bár mi azért megjegyeznénk, hogy egy GPU-s rendszereknél szerencsére eddig sem volt sok, mindössze néhány százalékról beszélhetünk.
A mezőny, GTX750Ti, a tesztgép
Az előző oldalon átbeszéltük, hogy miért is bánik takarékosabban az energiával a GM107 az eddigi GPU-khoz képest, úgyhogy ideje egy kicsit elmerülni a számokban. Mit is jelent pontosan, hogy energiahatékonyabb a Maxwell a Keplernél? Nos, az nVidia mérései szerint optimális esetben a Maxwell akár kétszer jobb teljesítmény/watt mutatóval rendelkezik, ami nem hangzik rosszul. Az első kártyák, amik Maxwell architektúrára épülnek, a középkategóriában indulnak a GTX750 és a GTX750 Ti személyében. Nekünk az utóbbihoz volt szerencsénk, de amint lehet, kipróbáljuk a GTX750-est is. Most viszont foglalkozzunk a sértetlen GM107-est magán cipelő GTX750 Ti-vel. Csupán a számokat nézve a mai mezőnybe helyezve a következőket tudja.
Az első, ami feltűnhet nekünk, hogy a GTX750 Ti kevesebb CUDA maggal akar nagyobb teljesítményt elérni, mint az elődje. Az architektúra alapján ez teljesen reális, a következő oldalakon majd kiderül azért, hogy mit mutat a gyakorlat. A textúrázok száma csökkent, de az esetek túlnyomó többségében ez elég kell legyen, a memória-sávszélesség pedig a GTX650 Ti-hez képest változatlan, itt érdekes lesz megfigyelni, hogy mit segít a nagyobb L2 cache. A legérdekesebb pont azonban kétségkívül a táblázat utolsó sora, ami arról árulkodik, hogy a GTX750 Ti-nek mindössze 60W-os TDP-je van. Ez majdnem a fele az elődének és a konkurens R7 260X-nek, és ez így elsőre nagyon jól hangzik.
Biztos feltűnik majd sok olvasónknak, hogy hiányzik a mezőnyből az egyébként elég jól sikerült GTX650 Ti Boost. Nos, az indok, amiért kihagytuk, nagyon egyszerű: szinte megszűnt létezni, és az nVidia diái se nagyon emlegetik már. A GTX750 Ti pedig tulajdonképpen az ő helyét veszi át.
Válaszul az nVidia kínálatában bekövetkező változásokra az AMD is megváltoztatta egy kicsit a portfólióját, a napokban felbukkant a híroldalak hasábjain az R7 250X és az R7 265-ös is. Előbbi tulajdonképpen nem más, mint egy HD7770-es, míg az utóbbi a lassan eltűnő HD7850-es helyét veszi át, és tulajdonképpen annak is felel meg, csak növeltek egy kicsit az órajelén. Mivel ezek a kártyák itthon még nem kaphatóak, ezért mi a teszthez az emlegetett HD7770-HD7850 duót használtuk, megfelelően beállított órajelekkel. Az R7 260X esetében pedig nagy a szórás órajelekben, szinte egyik gyártó sem használja a valamennyire referenciának tekinthető 1.1GHz-et (van akinek lassabb, van akinek gyorsabb a kártyája), de mi a teszt idejére a felhasznált ASUS kártya órajelét természetesen visszavettük a referenciára.
nVidia GeForce GTX750 Ti 2GB
Most pedig következzék a mai nap főszereplője az nVidia referencia kártyája, ami így néz ki!
Kicsinek tűnik? Az is. Még nem kaptuk meg a fotókat a termékről, mikor megérkezett a futár vele, így elsőre mi is csak pislogtunk, hogy tényleg ekkora lenne az egész? Egy ilyen apró hűtővel felszerelve? Nos, igen, ez a kártya a félmagas slotokkal rendelkező házakat leszámítva valószínűleg mindenben el fog férni (de igazából nem lepődnénk meg rajta, ha valamelyik gyártó megcsinálná félmagas változatban is). A 60 wattos TDP-nek hála a kártyának nincs szüksége külön tápcsatlakozóra, és meglepő módon a kis borda+ventilátor páros is azt bizonyítja, hogy nem nagy étvágyú a GM107. A ventilátor nem zajong, halkan képes megfelelő hőfokon tartani a GTX750 Titaniumot, még egy több órás tesztelés után is. A kimenetek között ezúttal két DVI-t és egy mini-HDMI-t fedezhetünk fel (szükség esetén az egyik DVI port átalakítható D-subbá).
Tesztkonfiguráció
Alaplap: Gigabyte GA-Z77X-UD3H
Processzor: Intel Core i5-3570k
Memória: 2x4GB Corsair Vengeance DDR3-1866
Grafikus kártyák: Sapphire R7 250 1GB GDDR5, Gigabyte HD7770 1GB GDDR5, Asus R7 260 1GB GDDR5, Asus R7 260X 2GB GDDR5, Sapphire HD7850 2GB GDDR5, Asus R7 270 2GB GDDR5, Gainward GeForce GTX650 1GB GDDR5, nVidia GeForce GTX650 Ti 1GB GDDR5, nVidia GeForce GTX750 Ti 2GB GDDR5, Gainward GTX660 2GB GDDR5
Tápegység: Cooler Master M2 Silent Pro 1000W
Operációs rendszer: Windows 8.1 64bit minden frissítéssel
Driverek: Catalyst 14.1 béta, GeForce 334.67 béta, GeForce 334.69 béta (a GTX750 Ti-hez)
Megjegyzés: a diagramokon a könnyebb átláthatóság végett csak a régi kártyák új neveit tüntetjük fel (HD7770 > R7 250X, HD7850OC > R7 265).
Fogyasztás, szintetikus tesztek
Fogyasztás
Üresjáratban a mezőny nagy része igen közel áll egymáshoz, csak a Pitcairn/Curacao alapú kártyák vannak minimálisan a többiek felett, úgyhogy általánosságban megint elmondható, hogy itt már a gyártók és a hűtők közötti különbség is beleszólhat az eredmények alakulásába (kétventilátoros DirectCU kártyák voltak pl. az R7 260-asok). A GTX750 Ti ezen a fronton úgy teljesít, mint Kepleres társai.
Terhelés alatt azért már szétugrik a mezőny. Eddig általában Alan Wake alatt mértünk, most azonban áttértünk a több játékost érdeklő Crysis 3-ra, ami alatt viszont kicsit máshogy viselkednek a kártyák. Ettől függetlenül láthatjuk, hogy a GTX750 Ti kb. annyit eszik csak, mint a GK107-es GPU-t használó GTX650-es, ez nagyon szép eredmény, valószínűleg sok notebook tervező/gyártó cég kedvence lesz a jövőben a Maxwell architektúra. Azért az is megfigyelhető, hogy a TDP értékeknek nem sok köze van a valósághoz, hiszen a fenti számok alapján a cégek néha felül, néha alul becsülik a kártyáikat ezen a fronton. Alan Wake alatt egyébként a 750 Ti-vel szerelt gép 138 wattot fogyasztott, az R7 260X-es 166-ot, míg az R7 265-ös 187-et, tehát ott kicsit nagyobb volt a különbség, a 750 előnyére.
Szintetikus tesztek
A szintetikus tesztek azt mutatják, hogy tényleg hiába van kevesebb feldolgozó a Maxwelles GTX750 Ti-ben, sokkal gyorsabb, mint a GTX650 Ti. A különbség a 3DMark Fire Strike tesztjének Extrém beállításán a leglátványosabb, ott az új kártya kétszer gyorsabb, mint elődje. Mivel ez a teszt eléggé sávszélesség igényes tud lenni, valószínűsíthető, hogy a nagy L2 gyorsítótára van a GM107 segítségére.
Játéktesztek 1/2
Az első kilenc teszt alapján elmondható, hogy a GTX750 Ti teljesítményben valahol az R7 260X környékén van, átlagban talán kicsit gyorsabb nála, de egyébként minden az adott játéktól függ. A Bioshock Infinite például szereti az nVidia kártyáit, míg a Company of Heroes 2 inkább az AMD-nek kedvez. A BF4-nél nagyon sok függ attól, hogy hol mérünk, de átlagban abban is az AMD-nek áll a zászló. Érdekes módon egyébként a Blood Dragon alatt meglehetősen jól teljesít a GTX750 Ti, pedig az is az AMD felé szokott hajlani egy kicsit. Lássuk, mit mutatnak a következő tesztek, van még belőlük bőven.
Játéktesztek 2/2 és tuning
A Hitman pl. szereti a sávszélességet, a 256 bites memória-vezérlővel ellátott kártyák fölénye látszik is (persze nem csak ennek köszönhetik, de itt fontos). A Mafia 2-nél sajnos pár Radeon megmakacsolta magát, így az átlagolásból ki is hagytuk a játékot. Azért a többiek eredményeit megmutatjuk érdekességképpen. Összességében egyébként kb. ugyanazt láthatjuk, mint az előző oldalon, csak itt kevesebb az olyan játék, ami húz valamelyik gyártó irányába.
Tuningeredmények
Az nVidia még buzdított is minket arra, hogy tuningoljuk a kártyát, merthogy remek tuningpotenciállal rendelkezik. Mi az AfterBurnerrel estünk neki, az nem engedte a power limitet 100% fölé vinni, és órajelben is „csak” +135MHz-et engedélyezett, de azt minden gond nélkül vitte a kártya, úgyhogy nem lennénk meglepve, ha ellepnék a polcokat a gyárilag tuningolt példányok. A memóriát sem hagytuk békén természetesen, 6GHz-en még betonstabilan működött, le is futtattunk pár mérést, íme az eredmények:
Átlagban bő 10%-os gyorsulást mértünk, ami arányos a tuningunkkal, szép eredmény. Még egy kicsi plusz tuning és nem lehetetlen a GTX660 befogása sem a kis GM107-essel. Gyári órajeleken egyébként a mi kártyánk maximális boost órajele 1150MHz volt, erre jött még rá a 135MHz.
Verdikt
Elérkeztünk az ítélethirdetéshez, de mielőtt elkezdenénk következtetéseket levonni, vessünk egy pillantást az tesztek eredményeit összesítő diagramra, ami természetesen most sem tartalmazza a szintetikus tesztek eredményeit (és jelen esetben a Mafia 2-ét sem).
A GeForce GTX750 Ti átlagban kb. 20 százalékkal gyorsabb a névbeli elődjénél, ami tekintve, hogy kevesebb CUDA magot tartalmaz, és ugyanakkora memória-sávszélességgel gazdálkodik, nagyon szép érték. Az nVidiának tényleg sokat sikerült javítania a hatékonyságon. A konkurenciával szemben ez azt jelenti, hogy a GTX750 Ti az R7 260X komoly ellenfele. Pontos bolti árakat egyelőre nem tudunk mondani, kell majd 1-2 hét mire beállnak az újdonságok árai a végleges értékükre, de a GTX750 Ti 2GB ajánlott végfelhasználói ára 43 990 forint lesz, ami azért soknak tűnik, hiszen az R7 265 fog kb. ennyibe kerülni (kiindulva a 7850-esek mostani áraiból). A jó hírünk viszont az, hogy az ajánlott árak csak a drágább kártyáknál szoktak feltűnni, becsléseink szerint 40 ezer forint környékén lehet majd kapni GTX750 Titaniumot, tehát az ára valahol az R7 260X és az R7 265 között lesz.
Hasonlítsuk egy kicsit össze az R7 260X-et és a GTX750 Titaniumot. Előbbi előnye, hogy támogatja a Mantle API-t, a TrueAudio-t és a DirectX 11.2-t. Sajnos egyelőre ezen tulajdonságokból szinte semmit sem tud kamatoztatni a kártya, de idén ha DX 11.2-es játékokra nem is nagyon számítunk, azért pár Mantle és TruAudio támogatásosra igen. Persze mondhatnánk, hogy a BF4 már támogatja a Mantle API-t, de a méréseink szerint ebben a régióban ez nem nagyon, vagy csak alig jár teljesítménytöbblettel, később majd külön cikk keretében foglalkozunk a témával, ha megjelent már a Thief is, hogy ne csak egy játék alapján ugorjunk konklúziókba.
A GTX750 Ti előnyei a 260X-hez képest ugyanilyen könnyen összefoglalhatóak: érezhetően alacsonyabb fogyasztás, Shadowplay (immáron fejlettebb NVENC motorral), PhysX és természetesen G-Sync támogatás. Az igazi ereje a kártyának abban rejlik, hogy a felsorolás utolsó tagját leszámítva ezek mind olyan előnyök, amik már most is éreztetik a hatásukat. Rengetegen használják streamelésre a Twitch-en a Shadowplayt, mert így nincs szükségük izmos processzorra, az alacsony fogyasztás előnyeit pedig nem kell ecsetelni, itt már tényleg van akkora a különbség, hogy érdemes megemlíteni. A GTX750 Ti ugyanis a legerősebb olyan kártya, ami nem igényel plusz tápcsatlakozót, és ezzel valószínűleg sok apró gamer kuckóba költözhet majd be a jövőben, vagy, ami hosszútávon az nVidia számára még fontosabb lehet: sok notebookba. Ott ugyanis még fontosabb a fogyasztás (és ezáltal az akkumulátoros üzemidő és a hőtermelés) kérdése, valószínűleg sok gyártó fog lecsapni az első Maxwelles chipekre.
A végső döntés természetesen most is egyéni preferencia kérdése: a Radeon jövőállóbb felépítéssel kecsegtet, míg a GeForce a hatékonyságával, és a már most is hasznos előnyeivel tűnik ki a mezőnyből. A végleges árak és az esetleges akciók (pl. ajándék játékok) is segíthetnek majd a döntésben, de még ezektől függetlenül is kap tőlünk a GTX750 Ti egy ajánlott plecsnit, mert meggyőző volt a produkciója.
GeForce GTX750Ti