Górcső alatt a Bulldozer architektúra

Az AMD rövidesen hódító útjára indítja következő generációs x86-os architektúra köré épülő processzorait, amelyek a K10(.5) Stars architektúra köré épülő processzorok utódai lesznek. A K10-es és K10.5-ös alapokon nyugvó termékek nem voltak annyira sikeresek, mint annak idején a K8-as processzorok, de a Bulldozer architektúrára épülő termékek piacra dobásával a gyártó újra ütőképes asztali megoldásokkal szállhat harcba riválisa ellen.

Górcső alatt a Bulldozer architektúra

Az AMD rövidesen hódító útjára indítja következő generációs x86-os architektúrája köré épülő processzorait, amelyek a K10(.5) Stars architektúra köré épülő processzorok utódai lesznek. A K10-es és K10.5-ös alapokon nyugvó termékek nem voltak annyira sikeresek, mint annak idején a K8-as processzorok, de a Bulldozer architektúrára épülő termékek piacra dobásával a gyártó újra ütőképes desktop és szerver megoldásokkal szállhat harcba riválisa ellen.

A Bulldozer alapú megoldások teljesen más rendszer szerint üzemelnek majd, mint azok a processzorok, amelyeket eddig láthattunk. A gyártó szerint a HyperThreadinges és többmagos processzorokat egyaránt felül tudja majd múlni párhuzamos feladatvégzésben. A Bulldozerek "magonként" 8 darab, széles integer futószalaggal állnak majd a programszálak rendelkezésére, ami a K10 magonkénti 3 és a Westmere magonkénti 4 integer futószalagjához képest nagy előrelépés lehet, bár mint lejjebb látjuk majd az AMD a nagy párhuzamosság miatt két magnak számol egy Bulldozer modult. Visszatérve az integer futószalagokra, azok két blokkba tömörülnek és egy 128 bites lebegőpontos blokk van mellettük, ezen a szálaknak osztozniuk kell.

A Hyperthreadinghez képest azért lehet hatásos az új elgondolás, mert a dekódoló egyszerre küld utasításokat mindegyik blokknak, és az integeresek saját L1 adat cache-sel rendelkeznek a lehető leggyorsabb feldolgozás érdekében.

A Bulldozer architektúrát a gyártó találó módon egy dízel motorhoz hasonlítja: alacsony órajel mellett nagymennyiségű utasítás végrehajtása másodpercenként (dízel motoroknál alacsony fordulatszám esetén is magas nyomaték áll rendelkezésre, innen a hasonlat). Az AMD a friss architektúrától azt várja, hogy a vele ellátott processzorok alacsony órajelen jóval magasabb IPC (Instructions per clock, műveletek száma órajelenként) teljesítményt kínálnak majd, mint a rivális megoldások. A 65 nm-es csíkszélességgel készülő Barcelona vagy a 45 nm-es Shanghai szerver processzorok esetében az IPC teljesítményt szintetikusan növelték (magasabb uncore/northbridge órajelek, L3 cache), míg a 32 nm-es csíkszélességgel készülő Bulldozer alapú processzoroknál a szélesebb, nyolc integer futószalagot tartalmazó integer egység biztosítja majd a teljesítmény növekedést, amely két részre van osztva, saját időzítővel és L1 adat gyorsítótárral.

Korábban, amikor az elemzők nagy reményt fűztek az AMD Barcelona architektúrájához, amely 128-bites széles lebegőpontos egységeket használ, sajnos csalódniuk kellett. Akkoriban azt hitték, hogy az új megoldással az AMD legyőzi a számára nagy problémát jelentő lebegőpontos számítási teljesítmény köré tornyosuló akadályokat, ám ez nem így lett: a processzor számítási teljesítményét a lebegőpontos egységek limitálták, azt még nem tudjuk ezen a fronton hogy fog muzsikálni a Bulldozer.

Az AMD az általa alkalmazott SMT (Simultaneous MultiThreading) technológia keretein belül a dedikált egységekhez, azaz a két integer tömbhöz egy-egy programszálat tud rendelni, vagyis ezek tulajdonképpen úgy viselkednek, mint egy-egy processzormag. Az integer tömbök a magon belül található megosztott részeket egymás között megosztva tudják használni, így az egyes tömbök a processzormagon belül tulajdonképpen egy önálló, hatékonyan működő magot alkotnak. A Bulldozer lapka egy-egy magja így tulajdonképpen egy-egy kétmagos modulnak tekinthető és egy Bulldozer alapú chip modelltől függően több ilyen modulból is állhat. Egy Bulldozer processzor a felsoroltakon kívül tartalmaz még beépített memória vezérlőt, megosztott harmadszintű gyorsítótárat és PCI Express vezérlőt is. Az északi híd ezzel a processzorba kerül, a déli híddal pedig A-Link Express kapcsolat köti majd össze az egységet, ami ugyancsak PCI-Express alapú. Az új processzorok a változtatások miatt sem a Socket AM2+, sem pedig a Socket AM3-as processzorfoglalatokba nem passzolnak, hanem egy teljesen új tokozást használnak majd.

A fentiek eredményeként létrejön egy chip, amely 8 maggal rendelkezik, de magjának felülete sokkal kisebb és a benne található tranzisztorok száma is kisebb, legalábbis, ha egy képzeletbeli 32 nm-es csíkszélességgel készülő K10-es architektúrát használó nyolcmagos processzorhoz hasonlítjuk. Az AMD saját SMT megoldása az operációs rendszerek számára láthatatlan lesz, azaz az OS számára fix mennyiségű logikai processzor áll majd rendelkezésre, amelyek használatához sem speciális szoftverre, sem külön driver alkalmazására nem lesz szükség.

Az AMD jelenleg úgy látja, hogy a Magny-Cours szerverprocesszorokhoz hasonlítva  - amelyek két négymagos Shanghai, illetve két hatmagos Istanbul lapkából épülnek fel -  a négy modulból álló, azaz nyolc maggal rendelkező Bulldozer alapú processzorok 50%-kal jobban teljesítenek majd teljesítmény/Watt arány tekintetében azonos TDP értéken belül.

A teljes diasor innen tölthető le: klikk.

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward