Egy érdekes elemzés látott napvilágot a Morgan Stanley szakembereitől, ami alapján sejthető, nagyjából mennyibe kerül egy NVL72 típusú, Blackwell Ultra alapokon nyugvó Nvidia AI rack hűtése. A nagyteljesítményű hardver által termelt hőt egyedi folyadékhűtés tartja kordában, ami igen-igen masszív költséget jelent, viszont az alatta dolgozó hardver sem éppen kispályás.
A beszámoló szerint az egyetlen rackszekrényben helyet foglaló hűtőrendszer költsége 49860 dollár magasságában helyezkedhet el, amit annak fényében érdemes nézni, hogy egy-egy fiók fogyasztása 6,6 KW magasságában lehet, egy szekrény pedig 18 fiókból áll. Egy-egy fiókban két Grace processzor és nyolc darab Blackwell Ultra GPU lapul, amelyek közül előbbiek egyenként 300 W-ot, utóbbiak pedig egyenként 1400 W-ot fogyasztanak, míg a SoCAMM típusú memória egy foglalatra vetítve 200 W-ot kér. A folyadékhűtés tehát fiókonként két processzort és nyolc GPU-t szolgál ki, a SoCAMM memóriamodulokra ugyanis passzív hűtőbordák kerülnek. A speciális folyadékhűtő szettnek összesen 6,2 KW-nyi hűtőteljesítményt kell nyújtania fiókonként, ami masszív igény.
Egy-egy fiók esetében 2260 dollár körül helyezkedik el a hűtéshez tartozó komponensek ára, így a 18 darab fiók esetében ez 40680 dollárra rúg. Ezzel egy időben az NWSwitch tálcák hűtése darabonként 1020 dollárt kóstál, mivel ezekből 9 lapul a rendszerben, így 9180 dolláros költséggel kell számolni. A legdrágább komponensek természetesen a processzorok és a grafikus processzorok hűtését végző egyedi folyadékhűtő blokkok, amelyek egyenként 300 dollárba kerülnek, míg az NVSwitch ASIC fölött elhelyezkedő folyadékhűtő blokk esetében 200 dolláros darabár van érvényben.
A Morgan Stanley elemzői azt is kiszámolták, mennyibe kerülhet majd a következő generációt képviselő Vera Rubin NVL144 rackszekrény hűtése. Ebben az esetben nagyjából 18%-os drágulásra lehet számítani, ami azt jelenti, hogy egy-egy fiókra vetítve 2660 dolláros költség jöhet össze. A számítási feladatokat végző hardvert tartalmazó fiókok hűtésének költsége 47880 dollárra emelkedhet, de a fiókok száma nem változik, viszont a nagyobb teljesítményű hardver hűtését segítő folyadékhűtő blokkok darabára 400 dollárra emelkedik. Ehhez képest a switch tálcák esetében még csökken is a hűtéshez használt komponensek ára, ami azt jelenti, hogy egy fiók hűtése 870 dollárba kerül majd, egy rackszekrényre vetítve ez 7830 dolláros kiadást jelenthet.
A GB200-as rendszerekről GB300-as hardverre történő váltásnál 20%-kal drágult a hűtés, míg a GB300 alapú NVL72-es rendszerekről Vera Rubin alapú NVL144-es rendszerekre történő váltásnál 17%-kal emelkedik ugyanez a költség, vagyis összesen 55710 dollárra rúg egy komplett rackszekrény esetében. A Vera Rubin platform esetében a Rubin alapú GPU-k már egyenként 1800 W-os fogyasztással működhetnek majd, és ez az érték a Rubin Ultra esetében duplázódik.
A Rubin Ultra GPU sorozatnál egy tokozáson belül négy GPU chiplet és 16 darab HBM4E chiplet foglal majd helyet, ami 3600 W-os TDP keretet eredményezhet, éppen ezért új, nagyobb hűtőteljesítményt biztosító folyadékhűtő blokkok alkalmazására lesz szükség, amelyek természetesen drágábbak is lesznek. Alternatív módon akár az immerziós, azaz a merítéses hűtés is szóba jöhet bizonyos esetekben, ahol a hardvert egy elektromosan nem vezető folyadékba merítik – ilyen rendszereket egyebek mellett az Intel is fejleszt. Az Nvidia az NVL576-os Kyber rackszekrények esetében, amelyeknél már 144 darab GPU chip lapul a fedélzeten, a Vera Rubin NVL144-hez képest, ami 72 GPU chipet tartalmaz, dupla teljesítményt nyújthat, cserébe viszont sokkal magasabb fogyasztás mellett üzemelhet.
Egy ekkora teljesítményű és fogyasztású hardver által termelt hő elvezetése már kihívásokat jelenthet, ami a költségekben is megmutatkozik majd, azaz 400 dollárnál drágább lehet egy-egy olyan folyadékhűtő blokk, ami 3,6 KW-nyi hő elvezetésére képes. Hogy pontosan milyen hűtést kap majd a Rubin Ultra alapú NVL576 Kyber rackszekrény? Idővel erre is választ kapunk majd.