Shop menü

ÓRIÁSI ÁTTÖRÉST ÉRT EL AZ ÚJ KÍNAI ALGORITMUS: AKÁR 800-SZOR GYORSABBAK LEHETNEK VELE AZ NVIDIA GPU-I BIZONYOS FELADATOKBAN

A peridinamika területére koncentráló fejlesztés révén már nincs égető szükség csúcsteljesítményű, korlátozások alá eső Nvidia hardverre a gyors számításokhoz, vagyis a széles körben hozzáférhető termékek is megfelelnek a célnak.
Víg Ferenc (J.o.k.e.r)
Víg Ferenc (J.o.k.e.r)
Óriási áttörést ért el az új kínai algoritmus: Akár 800-szor gyorsabbak lehetnek vele az Nvidia GPU-i bizonyos feladatokban

Egy kutatócsapat hatalmas jelentéségű áttörést ért el az elmúlt hónapok során a peridinamika terén, ugyanis egy olyan új algoritmust sikerült kifejleszteniük, ami drámai mértékben megnöveli a rendelkezésre álló GPU teljesítményét, méghozzá azáltal, hogy sokkal hatékonyabban használja fel az elérhető számítási teljesítményt a szimulációs és modellezéssel kapcsolatos feladatokra. Az áttörést a Shenzen MSU-BIT University csapata érte el, ami az orosz Lomonosov Moscov State University és a kínai Beijing Institute of Technology együttműködésében dolgozik. Az új fejlesztésnek főként a nagy léptékű anyagszimulációkban lesz haszna, amit számos területen lehet kamatoztatni: például a repülőgép-technikában, a hadászatban, valamint a mérnöki tervezés, az építés, illetve a gyártás folyamán is.

A peridinamika lényegében arra használható, hogy a szakemberek hatékonyan és viszonylag pontosan lemodellezzék, mennyire lesz strapabíró egy adott anyag, hol jelenhetnek meg repedések és törések a használat során, valamint az egyes fizikai behatások eredményeit is megmutathatja. Az efféle számítási feladatok rendszerint hatalmas számítási teljesítményt igényelnek a klasszikus soros és párhuzamos algoritmusok használata mellett, amihez nagy mennyiségű modern gyorsítóra van szükség, ezeket pedig jelenleg nehéz beszerezni az amerikai exportkorlátozások miatt, a helyi megoldások teljesítménye viszont limitált. A kutatók éppen ezért az algoritmus optimalizálására koncentráltak legutóbbi munkájuk során, méghozzá úgy, hogy az Nvidia CUDA technológiájára támaszkodtak, és úgy próbálták hatékonyabbá tenni a számításokat, hogy kisebb teljesítményű GPU mellett is eredményesebb működést érhessenek el. Az algoritmust memóriahasználat terén is optimalizálták, ami szintén kritikus szempont, hiszen a nagymennyiségű memóriával ellátott gyorsítók elérhetősége ugyancsak korlátozott.

A végeredmény, vagyis a PD-General keretrendszer igencsak impresszív eredményt tudott felmutatni, ugyanis a hagyományos soros algoritmusokhoz képest egy GeForce RTX 4070-es videokártya használata mellett akár 800-szoros gyorsulást is el tudtak érni, de az OpenMP alapú párhuzamos algoritmusokhoz képest is jelentős a gyorsulás, hiszen ennek mértéke akár a 100-szoros szintet is elérheti, feladattól függően. Ez óriási gyorsulást eredményez a komplex feladatok esetében, ami rendkívül látványos.

Galéria megnyitása

A kutatók szerint azoknál a nagy léptékű szimulációknál, amelyek több millió részecskét tartalmaznak, 4000 iteratív lépést mindössze 5 perc alatt képes volt teljesíteni a rendszer. Az ugyancsak nagy léptékű, de már két dimenzióban futó szimulációk esetében, ahol az egytengelyű szakítási problémákra fókuszált az algoritmus, összesen 69,85 millió iterációt tudott elkészíteni, ehhez pedig kevesebb, mint 2 perc is elegendő volt – egyszeres pontosság használata mellett. Ez az előrelépés lehetővé teszi a kutatók számára, hogy akár gamereknek szánt videokártyákat is bevessenek a fentebb említett komplex szimulációk lefuttatására, nem kell feltétlenül csúcskategóriás gyorsítókártyákat használniuk, ami egyébként költséghatékonyság terén is óriási előny.

A szimulációkat egyebek mellett repülőgép-, vagy űrhajó-alkatrészek strapabíróságának és fizikai behatásokkal szembeni ellenállásának modellezésére egyaránt lehet használni, de az építőiparban is jól jöhet, ha a földrengéseknek és egyéb környezeti hatásoknak ellenálló épületek, illetve épület-szerkezetek létrehozása a cél. Az újítás a különböző eszközök gyártásánál éppúgy jól jöhet, mint a hadászatban, ahol például ellenállóbb anyagokat fejleszthetnek a védelmi rendszerek hatékonyabb működéséhez. A lehetőségek tárháza igencsak széles.

Az újítás révén az amerikai szankciók által korlátozott csúcstechnológiás hardverekre nincs feltétlenül szükség, „gyengébb” hardverekkel, azaz például gamer videokártyákkal is sokkal hatékonyabban végrehajthatóak a kívánt feladatok, de ha „kerülőúton” mégis sikerül szert tenni csúcskategóriás gyorsítókra, az még tekintélyesebb gyorsulást hozhat az előzőleg használt algoritmusokhoz képest. A kutatók szerint az optimalizációk kapcsán szerzett tapasztalatok nemcsak a peridinamika területén kamatoztathatóak, hanem egyéb tudományos számítások terén is, azaz tényleg nagy jelentőséggel bír.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére