Shop menü

VALÓS IDŐBEN HOZ LÉTRE VIDEOJÁTÉK-SZERŰ KÖRNYEZETET A GOOGLE ÚJ MODELLJE

Genie modell nagyon gyorsan fejlődik, már a harmadik generációnál jár, és fontos újításokat kapott a Deep Mind csapattól.
Szécsi Dániel (DemonDani)
Szécsi Dániel (DemonDani)
Valós időben hoz létre videojáték-szerű környezetet a Google új modellje

A mesterséges intelligencia mögött álló modellek nagyon sokszínűek lehetnek annak függvényében, hogy milyen feladatra készülnek. A nyelvi modellek mellett ott vannak a vizuális modellek, és most éppen egy világ modell került terítékre a Genie 3 képében. Ezt a DeepMind alkotta meg, és egyre ígéreteseb virtuális világok megalkotására.

A Genie 3 arra szolgál, hogy 3D környezetet tudjon létrehozni alapinformációkra támaszkodva. Jelen esetben arról van szó, hogy elég mindössze egyetlen kép, amit kiindulási pontként használ fel a generatív MI. Ebből egy olyan közeget tud létrehozni, ami videojátékokat idézhet. Azt viszont hozzá kell tenni, hogy ott azért még nem tart, hogy komolyabb játékok megalkotására lehessen befogni. Az viszont egyértelmű, hogy a fejlesztések ebbe az irányba mutatnak.

Galéria megnyitása

Az új világ modell használata mellett olyan 3D környezetet lehet létrehozni a mesterséges intelligenciával, amivel egy irányítható karakterrel interakcióba lehet lépni, és a szimulált környezetben már megmaradnak az emberi cselekvés nyomai.

Tényleg olyan hatása van a Genie 3 által létrehozott tartalmaknak, mint egy játéknak, csak egyelőre még elég fapados formában. Viszont látni kell azt, hogy a korábbiakhoz képest már a jelenlegi állapot is egy komoly előrelépés. A decemberben bemutatott Genie 2 még csak egy nagyon rövid (10-20 mp) demót tudott előállítani, és a rendszer nem jegyezte azt meg, hogy mivel járul hozzá a generált 3D környezethez a felhasználó, így például ha egy festékcsíkot húzott a falra, akkor az utána eltűnt, most viszont már megmarad.

Galéria megnyitása

A Genie 3 világában MI ügynökök, ágensek is megjelenhetnek, amik ugyancsak kapcsolatba tudnak lépni a 3D világgal, mint ahogy a felhasználó teheti. Már több percen keresztül lehet a virtuális világban lenni, folyamatos interakcióban, amihez a mesterséges intelligencia valós időben hozhat létre elemeket. Az eddigi 360p-vel ellentétben a Genie 3 már 720p felbontásban megy, ami 24 FPS-sel társul, tehát éppen folyamatos, HD minőséget kapnak az érdeklődők.

Galéria megnyitása

Fontos újítása a Genie 3 modellnek, hogy már „utasítható világ eseményeket” is lehetővé tesz, ami azt jelenti, hogy a generáláshoz bevitt kép mellé lehet szöveges instrukciókat, promptot társítani, mellyel irányítható a 3D környezetben történő esemény. Például lehet szimulált időjárási eseményeket, környezeti hatásokat előidézni ilyen módon. Akár plusz karaktereket is fel lehet így venni, amik MI ágensként lépnek be a 3D térbe – hasonlóan, mint a játékokba az NPC-k.

Galéria megnyitása

Külön kiemelte a DeepMind a fejlesztéssel kapcsolatosan, hogy a Genie 3 modell már a szokványos felügyelet nélkül tanítható fel, és még csak környezeti adatcímkézést sem igényel a traning folyamatához. Képes szimpla videókból elsajátítani a 3D tér létrehozásához szükséges ismereteket. Arra nem tért ki a vállalat, hogy milyen forrásokból tanul, de minden bizonnyal a YouTube-on fellelhető tartalmakat hasznosítja. A Google arra már korábban kitért, hogy a YouTube videótárát használja MI tréningezésre a legkülönfélébb módokon.

Sajnos a Genie 3 még nem kipróbálható bárki számára, ezt egyelőre csak egy nagyon szűk kutatói kör veheti közelebbről szemügyre, és néhány akadémikus, tartalomkészítő is megnézheti. De idővel talán majd ez változni fog, és a vállalat elérhetővé tesz belőle egy korlátozottabb változatot, amiben élőben megtapasztalhatják az emberek, hogy mire képes a DeepMind nagy világ modellje. Állítólag a Google vizsgálja annak a lehetőségét, miként lehetne ebből egy tesztverziót létrehozni.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére