Haswell szintű teljesítményt kínál az Nvidia új processzora

A Denver processzormag teljesítménye és fogyasztása rendkívül bíztatónak tűnik, de azért egy-két dolog árnyalja a képet.

Haswell szintű teljesítményt kínál az Nvidia új processzora

A Hot Chips szimpózium alkalmával az Nvidia illetékesei is előrukkoltak néhány meglehetősen érdekes információval, amelyek a Denver processzormag képességeiről rántják le a leplet. A Denver az Nvidia első saját fejlesztésű processzora, amelyről már régóta szivárogtat apróbb információmorzsákat a cég. Most szerencsére újabb részletek derültek ki az újdonsággal kapcsolatban, amelyekből megtudhatjuk, hogy nagyjából milyen felépítése és teljesítménye lesz a chipnek.

A Denver jobban ki lesz gyúrva, mint az ARM Cortex-A15-ös processzormagja, mivel két Denver CPU mag kb. négy darab A15-ös processzormagot vált le – így lesz a Tegra K1-ből Denver alapú Tegra K1 64. Az is tudható, hogy a Denver az Apple Cyclone processzorát követve a második olyan ARM alapú megoldás lesz, amely 64-bites ARMv8-as alapokkal rendelkezik. A Denver alapú és a Cortex-A15 alapú Tegra K1-es SoC egységek lábkiosztás tekintetében kompatibilisek lesznek egymással, ami jelentősen megkönnyítheti a fejlesztők és a rendszerépítők dolgát.

Az Nvidia beszámolójának köszönhetően arra is fény derült, mire képes egy-egy Denver processzormag. A speciális megoldásoknak köszönhetően a Denver processzormag belsejében saját natív utasításkészlet dolgozik, a rendszer pedig az ARMv8-as utasításokat valós időben alakítja át. Hogy ennek mi értelme? Ezzel a módszerrel lehetőség nyílik némi dinamikus kód optimalizációra. A Denver processzormag végrehajtás előtt képes elemezni az ARM alapú megoldásokhoz passzoló kódot, valamint képes arra is, hogy megtalálja, mely utasításokat lehet összevonni – ilyesmire természetesen csak azoknál az utasításoknál van mód, amelyek nem függenek egymástól. Ha ezek megvannak, a jobb teljesítmény és a magasabb hatékonyság érdekében párhuzamosan hajtja végre őket. Hasonló megoldást már korábban is alkalmaztak egyes egzotikus CPU architektúráknál, elég csak a Transmeta x86 kompatibilis megoldására gondolni. Ez a módszer egyébként a nem-natív kódok emulációjára is használható a különböző alkalmazásokban.

A Denver bináris fordítórétege szoftveres megoldás, amely az operációs rendszernél alacsonyabb szinten fut. A már optimalizált kódokat 128 MB-os gyorsítótárba pakolja a rendszer, amit a rendszermemóriából foglal le. Az optimalizált kódrészletek innen később újra meghívhatóak és felhasználhatóak, ha szükséges.

A Denver esetében a végrehajtó részleg széles, de in-order rendszerben üzemel. Az out-of-orderhez képest jóval egyszerűbb in-order megoldás alkalmazása fogyasztáscsökkentéssel indokolható – ezt a módszert remekül kiegészíti a fentebb említett dinamikus kódoptimalizációs lehetőség. A végrehajtó egység egy hétutas szuperskalár megoldás, amely órajelenként hét művelet végrehajtására képes. Ennek fényében a Denver utasítás-végrehajtási csúcsteljesítménye meglehetősen magas lehet. Az persze már érdekesebb kérdés, hogy a tipikus utasítás-végrehajtási teljesítmény hogyan alakul hétköznapibbnak tekinthető átlagfelhasználói terhelések alkalmával, ez a terhelésforma ugyanis annyira változatos lehet, és annyi függőséget tartalmazhat, hogy a dinamikus optimalizációs motort komoly kihívások elé állíthatja. Ennek fényében a Denver csúcsteljesítménye bonyolultabb műveletsorok alkalmával gyengébb lehet.

Az Nvidia persze a jelek szerint nagyon elégedett és bizakodó az újdonsággal kapcsolatban: a cég állítása szerint teljesítmény tekintetében a Denver összehasonlítható a Haswell alapú, Core sorozatú processzorokkal. Ez persze meglehetősen optimista kijelentésnek tűnik, és minden bizonnyal leginkább olyan helyzetekre érvényes, ahol a Denver dinamikus optimalizációja hatékonyan tud előnyt kovácsolni a rendszer számára. Az Nvidia néhány teszteredményt is prezentált, amelyek népszerűbb szintetikus tesztalkalmazásokkal készültek. A diagramon látható eredmények alapján a Denver jól teljesít, igaz, nem szabad elfelejteni, hogy nem tudjuk, milyen platformmal készült a teszt, azaz nem ismertek a Tegra K1 64 SoC órajelei, valamint az sem, mennyire engedték elszaladni a fogyasztást – egy fejlesztőknek szánt platform jóval tágabb keretek között mozog, mint egy tábla, ez pedig jelentősen torzíthatja a képet.

A Denver processzormag természetesen fogyasztás-optimalizációs szolgáltatásokat is felvonultat: ezek között alacsony késleltetésű, energiaállapotok között gyorsan kapcsolgató tranzisztorok, kiterjedt tápkapuzás, illetve terheléstől függő dinamikus feszültség- és órajel-skálázás egyaránt jelen van. Ezeknek köszönhetően az Nvidia szerint a Denver teljesítménye a kereskedelem fő áramába szánt processzorok teljesítményével vetekszik, fogyasztása azonban mégis jelentősen alacsonyabb azokénál. Ez egy kicsit erős kijelentésnek tűnik, viszont kérdés, milyen processzor teljesítményével összehasonlítva született ez a megállapítás – valószínű, hogy inkább a Kaveri volt a referencia, és nem a Broadwell.

Az Nvidia tervei szerint a Tegra K1 64 alapú eszközök még idén forgalomba kerülnek, valamint Android L alapú fejlesztői platform érkezésére is lehet számítani.

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward