A Seagate fejlesztőcsapata egy érdekes ötlettel rukkolt elő: PCIe NVMe alapú merevlemezeket szeretnének kifejleszteni, amelyek költséghatékony adattárolónak minősülnének az ugyancsak PCIe NVMe alapú SSD meghajtókhoz és kártyákhoz képest, elsődleges célterületük pedig a mesterséges intelligenciával kapcsolatos feladatokat végző adatközpontok lehetnek.
A jelenlegi HDD architektúrák a több évtizedes I/O szabványok köré épülnek, amelyek az AI éra számára abszolút nem megfelelőek. A különböző merevlemez-technológiák fejlesztése persze korábban nem is az AI későbbi igényeinek szem előtt tartásával történt, hiszen az AI – a jelenlegi formájában – még nem volt elérhető, az aktuális igényeket pedig kiszolgálták a HDD korongokat alkalmazó adattárolók. Jelenleg az AI jellegű munkafolyamatok döntő többségéhez SSD alapú tárhelyet használnak, pont azért, mert az az optimális a felmerülő teljesítmény-igények kielégítéséhez – a jelenlegi merevlemezek abban a környezetben finoman szólva sem nyújtanának optimális teljesítményt, de hát ez nem egy meglepő dolog.
A Seagate fejlesztőcsapata éppen ezért úgy gondolja, érdemes lenne egy olyan új HDD platformot kifejleszteni, ami a PCIe NVMe protokollban rejlő lehetőségeket kamatoztatva hozzájárulhat ahhoz, hogy az AI feladatokat végző adatközpontok kellően ütőképes, ugyanakkor költséghatékony adattároló rendszereket építhessenek. Ehhez egy speciális környezet készülhetne, ahol SSD alapú gyorsítótár segítené a nagy adattároló kapacitást kínáló, HDD alapokon nyugvó adattároló rendszerek munkáját, a szettet pedig speciális DPU vezérelni, amihez PCIe alapokon keresztül kapcsolódna az adattároló rendszer. Ezen a DPU-n keresztül a konkrét szerver vagy munkaállomás is elérhetné a nagy kapacitású adattároló rendszert, méghozzá NVMe over Fabrics (NVMe-oF) alapokon.
Az új merevlemezek felépítése jelentősen eltérne a mostani modellekétől, az új dizájn pedig számos olyan érdekes funkciót tenne elérhetővé, ami jelenleg csak az SSD alapú tárhelyekkel használható. Az aktuális merevlemezek SATA vagy SAS csatolófelülettel rendelkeznek, tartalmaznak HBA-t (Host Bus Adapter), valamint olyan vezérlő-architektúrára támaszkodnak, ami egyszerűen nem felel meg az AI munkafolyamatok igényeinek. Ezzel szemben a PCIe NVMe alapú merevlemezek a tervek szerint ugyan továbbra is SATA/SAS csatolófelületet használhatnának annak érdekében, hogy a széles körű kompatibilitás fennmaradhasson, viszont nem tartalmaznak majd sem HBA-t, sem pedig egyedi vezérlőt.
A PCIe NVMe alapok révén az SSD-k és a HDD-k hatékonyabban, egyetlen NVMe szoftverrétegen keresztül működhetnének együtt, ami jótékonyan hatna a teljesítményre és az egyéb lehetőségekre. Utóbbiak közé tartozik annak a lehetősége, hogy a PCIe NVMe csatolót használó merevlemezekhez akár közvetlenül kapcsolódhatnak a GPU-k, a hagyományos adat-útvonalakat megkerülve, ezzel a belőlük fakadó korlátokat is átugorva, a CPU kihagyásával.
A Seagate csapata már konkrét tesztet is végzett ezen a téren, amelynek során az Nvidia BlueField DPU-it, vagyis adatfeldolgozó egységeit az AIStore szoftverrel kombinálták. A teljesítmény alakulásával kapcsolatban pontos számokat egyelőre még nem közöltek, azt viszont elárulták, milyen pozitívumokat tapasztaltak a próbák során. A DPU-k által vezérelt közvetlen kapcsolat alacsonyabb késleltetést biztosított adatelérés terén annak köszönhetően, hogy a GPU és az adattároló-rendszer direkt módon kommunikálhatott, valamint a SAS/SATA interfészekből eredő extra terhelést is sikerült száműzni, és összességében sokkal egyszerűbb rendszer-architektúrát tudtak felépíteni. Az AIStore szoftver ráadásul segített az adat-gyorsítótárazásának hatékony vezérlésében, ami növelte az AI modell tréningezésére fordítható teljesítményt, míg az NVMe-oF integráció révén a több rackre támaszkodó adattároló-fürtben rejlő lehetőségeket is kamatoztatni lehetett.
Az új fejlesztés a Seagate szerint rengeteg előnnyel jár. Az NVMe protokollt használó merevlemezek a Seagate szerint tízszer hatékonyabbak az 1 TB-ra jutó széndioxid kibocsátás terén (Embodied Carbon), négyszer energiahatékonyabbak fogyasztás tekintetében, valamint sokkal kedvezőbbek 1 TB-nyi tárhelyre jutó költségek terén, mint az SSD-k. A fejlesztőcsapat már dolgozik a HAMR alapú Mozaic 3+ platform skálázásán, hogy még nagyobb adattároló kapacitású merevlemezeket kínálhassanak, közben pedig az NVMe alapú adattároló megoldások feltérképezésén is ügyködnek.