Shop menü

RÉSZLETEK AZ AMD STEAMROLLER ARCHITEKTÚRÁJÁRÓL

A Piledriver utódjaként szolgáló mikro-architektúra már látványosabb előrelépés lesz a Bulldozerhez képest.
Víg Ferenc (J.o.k.e.r)
Víg Ferenc (J.o.k.e.r)
Részletek az AMD Steamroller architektúrájáról

Az AMD korábban nagy reményeket főzött a Bulldozer mikro-architektúrához, amely a várakozások ellenére finoman szólva sem hozta azt a szintet, ami elvárható lett volna. Persze az új mikro-architektúrák esetében mindig vannak kisebb-nagyobb problémák, ugyanakkor van némi mozgástér is a gyengeségek kijavítására és a teljesítmény növelésére. A Bulldozer esetében kicsit többről volt szó, mint megszokott, általános problémákról, így most már csak az a kérdés: vajon van elég mozgástér ahhoz, hogy a következő revíziók esetében sikerüljön növelni az architektúra hatékonyságát és így az órajelenként végrehajtható műveletek számát?

Az első megoldás, amely a Bulldozer továbbfejlesztett változatának tekinthető, nem más, mint a Piledriver mikro-architektúra, amely esőként a mobil Trinity APU egységekben debütált. Az újdonság által kínált teljesítménynövekedést meglehetősen szerény, de a friss megoldások dinamikus feszültség- és órajel skálázása azért mégis segített abban, hogy a Trinity lényegesen jobb watt/teljesítmény arányt kínáljon, mint a Llano, amely persze nem Bulldozer, hanem egy korábbi, Stars CPU mikro-architektúrára alapoz. A Piledriver mikro-architektúra kétségtelenül menetel az asztali szegmens felé: hamarosan megjelennek az asztali Trinity APU egységek és velük együtt az új, következő generációs FX sorozatú processzorok, a Vishera kódnévre keresztelt központi egységek is.

Most mégsem ezekkel, hanem a Piledriver mikro-architektúrát követő újdonsággal, a Steamroller-rel foglalkozunk, amelyről az AMD vezető technológiai igazgatója, Mark Papermaster azt ígéri, hogy jelentősebb teljesítménynövekedést kínál majd.

Galéria megnyitása

A Bulldozer mikro-architektúra köré épülő processzorok gyengesége az, hogy meglehetősen alacsony teljesítményt kínálnak, ha egy szálon futó, egy processzormagot érintő terhelésről van szó. A korábbi vélemények szerint a Bulldozer sikerességét gátoló elsődleges probléma a megosztott Front End részben keresendő. A Steamroller esetében ezt a részt át fogják dolgozni, így mindkét Integer részegység dedikált dekódereket kap és ezzel együtt a korábbinál nagyobb utasítás gyorsítótár is rendelkezésükre fog állni.

Galéria megnyitása

A fenti változtatás komoly előrelépéseket hoz. A branch misprediction esetében 20%-os javulás várható, az utasítás gyorsítótár esetében pedig 30%-kal kevesebb hibázásra számíthatunk. A szálankénti utasítás-feladatirányító egységek, amelyek a végrehajtó egységek teljes sávszélességét igénybe veszik, 25%-kal növekszenek. Ennek eredményeként az első szimulációk alapján kliens oldalon jelentkező terhelésfajtáknál – digitális médiával kapcsolatos produktivitás és játékok esetében – 30% körüli teljesítménynövekedés jelentkezhet órajelenkénti műveletkiküldés tekintetében.

Galéria megnyitása

Feltehetőleg az újragondolt Front End lesz az egyetlen komolyabb előrelépés a Steamroller esetében, viszont ezek a változások egyáltalán nem elhanyagolható jelentőséggel bírnak, vagyis az összteljesítményre is komoly hatást gyakorolnak. A Front End rész változásainak köszönhetően 5-10%-os időzítési hatékonyság-növekedés várható, amelyet megint csak kliensoldali terhelésformák szimulációjával mértek le a vállalat szakemberei.

A Steamrroller esetében enegiahatékonysággal kapcsolatos változtatások is helyet kapnak a repertoárban. Egyrészt fejlődik, hatékonyabbá válik az utasítás behívás, másrészt lehetőség nyílik a másodszintű gyorsítótár dinamikus átméretezésére is, ami szintén fontos lehetőség. A másodszintű gyorsítótár egy megosztott erőforrásnak számít a két integer mag között, amelynél mód lesz arra, hogy ha nincs szükség a teljes L2 cache méretére, akkor egyes részeit energiatakarékossági céllal kikapcsolhatja a rendszer.

Galéria megnyitása

Ezzel együtt a lebegőpontos teljesítmény kiegyensúlyozására is számíthatunk. A Bulldozer mikro-architektúra által kínált lebegőpontos teljesítmény gyenge, ugyanis egy FPU-n osztozik a két Integer egység. Az FPU végrehajtó egységének „áramvonalasabbá tételével” valószínűleg lehetőség nyílik némi fogyasztáscsökkentésre, ugyanakkor kérdéses, hogy ez miként hat a lebegőpontos teljesítményre. Az AMD persze megnyugtatta az aggódókat: az FPU egységek képességein nem esik csorba. Arról van szó, hogy a vállalat mérnökei egyszerűen találtak némi redundanciát – például az MMX egységekben – és újra felhasználnak néhány hardverkomponenset annak érdekében, hogy fogyasztást és kiterjedést csökkenthessenek, de ezek a lépések összességükben nem gyakorolnak negatív hatást a teljesítményre.

Galéria megnyitása

A mérnökök – ahogy az a fenti dián is látható – az FPU egyes részeit optimalizálva el tudják érni, hogy ugyanazt a 32 nm-es gyártástechnológiát alkalmazva, ugyanazt a funkciót kínáló logikai egység 30%-kal kisebb területen férjen el, és 30%-kal alacsonyabb energiafelhasználás mellett üzemeljen (High Density Library). Az egyelőre nem világos, hogy a fentihez hasonló optimalizációval melyik termékben találkozhatunk először.

Szó esett persze arról az összekapcsoló technológiáról is, amely a SeaMicro korábbi felvásárlásának eredményeként áll az AMD rendelkezésére. A technológiát a vállalat időközben Freedom Fabric névre keresztelte.

Galéria megnyitása

A felvásárlással egy időben a SeaMicro még nem kínált Opteron alapú megoldásokat, de az AMD már akkoriban kijelentette, hogy ez a helyzet az idei év második felében egészen biztosan megváltozik majd. A lenti fotó bizonyíték az említett ígéretre: a képen egy speciális kártya látható, amelyen Opteron 4256-os processzor, valamint két darab DDR3-as So-DIMM memóriamodul teljesít szolgálatot. A kártya felső részén látható, SeaMicro felirattal ellátott chipek felelnek a gyors kommunikációért a rendszer és a kártyák között. Ilyen kártyákból egy-egy szerverházba több darab is bepakolható lesz, így nagysűrűségű felhő alapú szerverek építhetőek.

Galéria megnyitása

Reméljük, a nem is oly távoli jövőben további információk is napvilágot láthatnak a Streamroller architektúrával és a többi újdonsággal kapcsolatban. Akkor majd kiderül, hogy a Steamroller összességében mekkora IPC növekményt kínál a Piledriver-hez képest.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére