Shop menü

RAJA KODURI ELÁRULTA, MILYEN TELJESÍTMÉNYRE KÉPES AZ INTEL XE HP GPU

A lényeg nem is annyira a teljesítmény volt, hanem inkább az, milyen jól skálázódik az Xe architektúra, ha 1, 2, illetve 4 lapkának kell együttműködnie egyetlen tokozáson belül.
Víg Ferenc (J.o.k.e.r)
Víg Ferenc (J.o.k.e.r)
Raja Koduri elárulta, milyen teljesítményre képes az Intel Xe HP GPU

Az Intel a Tiger Lake SoC legfontosabb tulajdonságairól már beszélt nemrégiben, valamint az Xe sorozatú GPU családról is szó esett egy előadás keretén belül, most azonban a Hot Chips 32 alkalmával is szóba került néhány újdonság. Ezek közül először az Xe HP sorozatú grafikus processzorral foglalkozunk, amit maga Raja Koduri, a fejlesztésért felelős csoport vezetője mutatott be.

Galéria megnyitása

Ráadásul az Xe HP sorozat egyik csúcsmodellje, a négy lapkával rendelkező változat került terítékre, ami a legnagyobb Xe HP GPU lesz. A fotó alapján tényleg nem tűnik aprónak az MCM rendszerű GPU, ám most nem is ez a lényeg, hanem az, hogy az egyes lapkák, amelyek a tokozáson belül foglalnak helyet, milyen teljesítményre képesek, illetve hogyan skálázódik maga az Xe architektúra.

A demó alkalmával egyetlen aktív lapka mellett 10588 GFLOP/s-os számítási teljesítményt sikerült elérni, míg két aktív lapkával már 21161 GFLOP/s-os teljesítmény mutatkozott, azaz majdnem pontosan kétszer gyorsabb volt a kétlapkás rendszer (1,999X). Négy lapka mellett már 41908 GFLOP/s-os teljesítmény mutatkozott, ami szintén nagyon jó skálázódást jelent, hiszen az egylapkás rendszerhez képest 3,993x gyorsabb volt a négylapkás megoldás. A tesztek mindhárom esetben egyszeres pontosságot igénylő számítási feladattal zajlottak (FP32), a lapkák között pedig EMIB kapcsolat húzódott.

Galéria megnyitása

Érdekesség, hogy Raja Korudi szerint a négylapkás, vagyis a leggyorsabb Xe HP GPU esetében elérhető a PETAFLOP/s-os teljesítményszint is, amennyiben gépi tanulásra, illetve mesterséges intelligenciával kapcsolatos feladatvégzésre kerül sor, hála a fedélzeten lévő Tensor magoknak. Ha abból indulunk ki, hogy a GPU 2048 EU-val rendelkezik (4 x 512), órajelenként 128 művelet elvégzésére képes és 2 FMA egységgel rendelkezik, akkor 524288 TFLOP/s-os teljesítmény jön ki, azaz a PETAFLOP/s-os szint eléréséhez közel 2 GHz-es órajelre lehet szükség. A fenti tesztek egyébként 1300 MHz-es órajelen készültek, ahogy az a fenti ábrán látható.

Nincs kizárva az sem, hogy a Tensor magok elrendezésre más, és nem egy EU-ra nem egy Tensor mag jut, így 128-nál több művelet elvégzésére is lehetőség nyílhat egy-egy órajel alatt. Ez a terület remélhetőleg hamarosan tisztulni fog, az Xe HP GPU persze már most is ígéretesnek tűnik.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére