Shop menü

AZ NVIDIA ÉS A KIOXIA ÖSSZEFOG: 2027-RE 100 MILLIÓ IOPS-OS TELJESÍTMÉNYŰ SSD-K KÉSZÜLHETNEK AZ AI PIACRA

Az új SSD típussal hatalmas gyorsulást lehetne elérni AI fronton.
Víg Ferenc (J.o.k.e.r)
Víg Ferenc (J.o.k.e.r)
Az Nvidia és a Kioxia összefog: 2027-re 100 millió IOPS-os teljesítményű SSD-k készülhetnek az AI piacra

A Kioxia és az Nvidia együttműködésének köszönhetően 2027-re elkészülhetnek az első olyan SSD-k, amelyek képesek lesznek akár 100 millió IOPS-os teljesítmény elérésére is, azaz jókora előrelépést hoznak majd a jelenlegi teljesítményszinthez képest, amiből elsősorban az AI szegmensben profitálhatnak majd a felek.

Az együttműködésről a Kioxia illetékesei számoltak be, akik azt is hozzátették, hogy rövidesen megkezdik a fejlesztőmunkát annak megfelelően, milyen célokat és elvárásokat fogalmaz meg az Nvidia csapata a kész termék képességeit illetően. Az információk szerint az Nvidia várhatóan két ilyen SSD-t is szeretne használni, amelyek közvetlenül kapcsolódhatnak az AI gyorsítók grafikus processzoraihoz, és együttesen összesen 200 millió IOPS-os teljesítményt kínálhatnak, ezzel jelentősen felgyorsítva az AI-hoz kapcsolódó adatok közvetlen elérését.

Galéria megnyitása

A tervek szerint az új SSD-k várhatóan PCI Express 7.0-s szabványú kapcsolatot használhatnak és közvetlenül kapcsolódhatnak a grafikus processzorokhoz, P2P (Peer-to-Peer) alapon, célterületük pedig egyértelműen az AI gyorsítók szegmense lesz, hiszen ott kiemelten fontos, hogy gyorsan és hatékonyan lehessen hozzáférni az éppen szükséges adatokhoz annak érdekében, hogy a különböző folyamatok gyorsítása hatékony lehessen.

Érdekesség, hogy korábban a Silicon Motion vezetője, Wallace Kou is megemlítette, az Nvidia csapta olyan SSD-t szeretne, ami 100 millió IOPS-os véletlenszerű olvasási teljesítményt kínáló SSD-re vágyik, ami a jelenlegi SSD-k szintjéhez képest 33-szoros előrelépést jelent. A jelenlegi SSD meghajtók nagyjából 3 millió IOPS-os teljesítményt nyújtanak 4K-s véletlenszerű olvasási vagy írási feladatok alkalmával, ami egyszerűen nem elegendő az Nvidia céljainak eléréséhez, így mindenképpen új meghajtókra van szükség, amelyek nagyságrendekkel gyorsabbak ezen a téren.

Mivel az AI munkafolyamatok futása során főként apró, de rendkívül gyakori véletlenszerű olvasási feladatokra lehet számítani, amikor a különböző adatok elérését végzi a rendszer, így erre a terhelésformára kell optimalizálni a majdani SSD-ket is. Ennek megfelelően 4 KB-os helyett inkább 512 bájtos blokkokat kell alkalmazni, ami ugyan a nyers sávszélesség alakulására rányomhatja bélyegét, cserébe viszont egyszerűbb skálázni az olvasási és az írási sebességeket azáltal, hogy több meghajtót alkalmaznak az adott adattároló rendszerben.

Galéria megnyitása

A feladathoz passzolhat a Kioxia által fejlesztett XL-Flash, ami lényegében egy nagy strapabírósággal rendelkező SLC NAND memória, ami nagyon alacsony késleltetéssel működik, és sebessége is viszonylag magas. Ezek az XL-Flash lapkák 16 részre osztva működnek(16-plane), miközben a modern 3D NAND Flash chipek jellemzően csak 3-6 területre osztva dolgozhatnak, azaz az XL-Flahs hozzájuk képest magasabb maximális adatátviteli sávszélességet kínálhat, valamint véletlenszerű írási és olvasási feladatok esetén is gyorsabb lehet. Mivel ez a memóriatípus még fejlesztés alatt áll, a Kioxia pedig egyelőre nem tette elérhetővé a konkrét specifikációit, így arra sem derült fény, sebességek terén pontosan mire is számíthatunk.

Abból kiindulva viszont, hogy egy Innogrit Tacoma típusú 400 GB-os XL-Flash SSD, ami 32 NAND chipből épül fel és ebből 7 az over-provisioning funkció működését segíti, 3,5 millió IOPS-os véletlenszerű olvasási és 0,5 millió IOPS-os véletlenszerű írási tempó elérésére képes PCI Express 5.0 x4-es csatolófelületen keresztül, arra lehet számítani, hogy egy-egy ilyen lapka nagyjából 110 000 IOPS-os véletlenszerű olvasási- és 15600 IOPS-os véletlenszerű írási teljesítményt nyújt. Ha a skálázódás közel lineáris, akkor a 100 millió IOPS-ra tehető 512B-os véletlenszerű olvasási sebesség 915 ilyen lapka segítségével biztosítható, ha ugyanazt az over-provisioning szintet vetik be.

Ez óriási mennyiségű lapka lenne, viszont a Kioxia már jelenleg is képes arra, hogy egyetlen chiptokozáson belülre akár 32 memórialapkát is összezsúfoljon, egymásra rétegezve, akkor máris sokkal barátságosabb szám jön ki: már 28 chipben elszállásolható a szükséges 915 memórialapka. Egy ilyen meghajtó kiszolgálásához PCI Express 5.0 x16-os, illetve PCI Express 7.0 x4-es csatolófelületre lehet szükség, ami akkoriban már rendelkezésre állhat, viszont a valóságban a skálázódás nem ennyire lineáris, hiszen a tényleges sebességet nagyon sok tényező befolyásolja. A legjobb esély egy efféle SSD hatékony felépítésére az lehetne, ha több tucatnyi vezérlőt és egy switchet használnának a nehézségek jó részének kiküszöböléséhez, ami nem egy egyszerű feladat, és a végeredmény is kérdéses.

Galéria megnyitása

A másik lehetőség a HBF (High Bandwidth Flash) technológia használata lehetne, amelynél egy-egy chip fedélzetén maximum 16 NAND Flash lapka kaphat helyet, alattuk egy logikai lapkával, ami akár vezérlő is lehetne. Ezek a lapkák tömbökbe csoportosítva használhatják a NAND Flash cellákat, ezáltal nagyon magas párhuzamos teljesítményt és magas adatátviteli sávszélességet érhetnek el.

Az egyelőre nem világos, melyik utat választja a Kioxia csapata, az viszont valószínű, hogy a HBF memóriatípussal végzett kísérletek során szerzett tapasztalatokat kamatoztatni fogják az új, kifejezetten magas teljesítményű SSD-k felépítésének megtervezése során. A projekttel kapcsolatban remélhetőleg konkrétumok is napvilágot láthatnak majd a nem is oly távoli jövőben.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére