Mit tanulhat a mesterséges intelligencia a GTA-ból?

1. oldal

Artur Filipowicz, a Princeton kutatója önvezető autók szoftvereinek fejlesztésével foglalkozik. Tavaly például azt igyekezett megtanítani egyik programjának, hogy az minden körülmény esetén képes legyen felismerni a stoptáblákat. Ehhez rengeteg közlekedési táblát mutatott meg a szoftvernek: régi és új táblákat, tisztákat és koszosakat, részben elfedett darabokat, vakító napfényben vagy szakadó esőben állókat, illetve ködben, és szürkületkor látszó táblákat.

Mindezen képek fotókönyvtárakban való felkutatása óriási feladat lett volna, azok tényleges lefotózása pedig még időigényesebbnek tűnt. Filipowicz ehelyett a Grand Theft Auto 5 nevű játékhoz fordult, amelyben a játékosoknak különböző bűnözők bőrébe bújva kell végrehajtaniuk bizonyos küldetéséket. A GTA 5-öt és a sorozat korábbi részeit sok kritika éri erőszakossága, és ennek kapcsán realisztikussága miatt is, Filipowicz szempontjából azonban ez ideális volt, mert a játékban nemcsak a bűnesetek és az erőszak valósághű, hanem a közlekedési táblák is. A szakértő rávette a programot, hogy adja ki neki több ezer, különböző helyzetekben látszódó stoptábla képét, majd ezeket betáplálta saját algoritmusába.

Az eset jó példája annak, miért kedvelik annyira a mestereséges intelligenciák fejlesztésével foglalkozók a videojátékokat. Sokan Filipowiczhoz hasonlóan próbaterepként használják ezeket a világokat a valósághoz. Mások azt remélik, hogy a különböző játékok és az azok által mozgósított különböző kognitív készségek segíthetnek megérteni az intelligencia lényegét, és azt, hogyan lehetne ezt kezelhető darabokra szétbontani. Megint mások az előző két feltevésre hagyatkozva úgy gondolják, hogy a játékok révén új elméleteket dolgozhatnak ki a mesterséges (és talán a természetes) intelligencia működéséről.

Ahhoz, hogy ez megtörténhessen, gyakran a játékokat is meg kell változtatni, hogy azokból egy másik program is tudjon profitálni. A GTA V például azon túl, hogy közlekedési táblák kimeríthetetlen forrása, egy Deep Drive nevű szoftver révén önvezető autók vezetési szimulátorává is átalakítható. És egy ilyen megoldás sokkal olcsóbb és biztonságosabb, mint a kocsikat irányító szoftverek tényleges utakon való tesztelése.

Szerepük fontosságára a játékfejlesztők is egyre inkább ráébrednek. 2015 júniusában a Microsoft például belevágott egy Project Malmo nevű kezdeményezésbe. Ez egy mesterséges intelligencia fejlesztő platform, amely a cég által nemrég felvásárolt Minecraft játékon alapul. 2016 novemberében a Starcarft II tulajdonosa, az Activision Blizzard jelentett be hasonló célú együttműködést a Google tulajdonában lévő DeepMinddal, amelynek neve többek közt onnan lehet ismerős, hogy ők fejlesztik a profi gójátékosokat sorra verő AlphaGo programot. 2016 végén az OpenAI nevű amerikai kutatócsoport mindenki számára hozzáférhetővé tette Universe nevű programját, amelynek segítségével több száz számítógépes játék vált más szoftverek által játszhatóvá.

A Microsoft célja saját projektjével, hogy megtanítsa az emberekkel együttműködni a mesterséges intelligenciát. Ennek érdekében a kezdeményezés vezetője, Katja Hofman a Minecraft révén igyekszik „kinevelni” egy fejlett személyi asszisztenst. A cél, hogy a szoftver a minél ügyesebben jósolja meg, hogy az emberi játékos mit akar, és segítse ennek megvalósításában. A Minecraft erre ideális terep lehet, hiszen jóval egyszerűbb, mint a való világ, de kellően bonyolult ahhoz, hogy az asszisztens program tanulhasson belőle. Hofman és kollégái például arra igyekeznek ráébreszteni szoftverüket, hogy mindenképp együtt kell működnie az emberi játékossal, ha el akar kapni egy virtuális malacot. Mindezt ráadásul pusztán az emberi játékosok akcióinak nézéséből, írott utasítások nélkül kell megtanulnia.

Ahogy már említettük, a hasonló játékok nem csak arra jók, hogy tesztterepként szolgáljanak a mesterséges intelligenciáknak. Mivel a különböző típusú játékok másfajta készségeket igényelnek, az intelligencia különböző alapelemeinek azonosítására is jól használhatók. 2015-ben a DeepMind szakértői közzétettek egy tanulmányt, amelyben arról számoltak be, hogyan tanítottak meg mesterséges neurális hálózatot különböző hetvenes-nyolcvanas években kifejlesztett Atari-játékokkal játszani.

Egyes játékok könnyebbnek, mások nehezebbnek bizonyultak a rendszer számára. A Breakout, amelyben egy pattogó labdával kell falat bontani, például jól ment neki. Itt ugyanis a játékosnak csak jobbra vagy balra kell mozgatnia az „ütőt”, hogy arról jó helyre pattanjon vissza a labda. Ha nem találja el a golyót, a büntetés azonnali: a játékos veszít egy életet. Ahogy a jutalom is rögtön megérkezik, hiszen a téglák eltalálása pontokat ér. A játék egyszerűsége és az azonnali visszacsatolás nagyon feküdt a DeepMind neurális hálózatának. A rendszer annyira jól megtanult játszani, hogy végül több mint 10-szer annyi pontot szerzett, mint a legjobb emberi játékosok.

Más játékok azonban kevésbé bizonyultak könnyen tanulhatónak. A Montezuma’s Revenge-ben például a cél egy veszélyekkel teli piramis mélyén található kincs megszerzése. Ennek elérése érdekében a játékosoknak egy sor kisebb célt kell elérniük, például meg kell találniuk az ajtókat nyitó kulcsokat. A visszacsatolás ráadásul még ezekben az alküldetésekben sem azonnali, hiszen az egyik helyen megtalált kulcs sokszor egy egészen másutt levő ajtót nyit. A végső feladat végrehajtásához, a kincs eléréséhez több ezer dolgot kell megtenni. A neurális hálózatnak pedig komoly gondjai akadtak ezzel, mert gyakran nem találta meg a logikai kapcsolatot a végrehajtandó lépések között. Míg faltörésben világbajnokká vált a rendszer, ez utóbbi játékban gyakorlatilag semmit nem tudott előre haladni.

2. oldal

A DeepMind fejlesztői azóta sokat javítottak rendszerükön: a felfedezőkedvet és a kísérletezést nagy jutalmakkal honorálva kíváncsibbá tették azt. Ennek eredményeként a hálózat sokkal jobbá vált az olyan stratégiák kidolgozásában, amelyek nem kecsegtetnek azonnali és nyilvánvaló nyereménnyel. Ez a megközelítés pedig nemcsak a virtuális világban, de a való életben is számos célra hasznos lehet.

A DeepMind hasonló algoritmusait már jelenleg is alkalmazzák a Google adatközpontjaiban, és ezeknek köszönhetően a központok energiafogyasztása 40 százalékkal csökkent. A neurális hálózatok ezt többek közt úgy érték el, hogy kedvük szerint változtathatják a hűtőfolyadék szivattyúk működését. Az egész olyan, mint egy játék számukra: egy sor dolgot vezérelhetnek, és a cél az, hogy minél kisebb energiafogyasztási pontszámot érjenek el.

Jelen pillanatban a program energiaspórolásra való megtanítása valóban olyan, mintha egy teljesen új játékot tanulna meg a neurális hálózat. A DeepMind eredeti hálózata ugyanis egyszerre csak egy játékot képes ismerni. Ahhoz, hogy a Breakoutot megértse, mindent el kell felejtenie a korábban megtanult játékokról. Ez a fajta „amnézia” jelenleg még a neurális hálózatok szükséges velejárója, és talán ez különbözteti meg ezeket leginkább az igazi agyaktól. A rendszer a virtuális neuronok közti kapcsolatok erősségének változtatása révén tanul, és ahhoz, hogy valami újat sajátíthasson el, az előző kapcsolódásoknak felül kell íródniuk.

Ez azonban rövidesen megváltozhat. A DeepMind programozói ugyanis idei tanulmányukban már arról számolnak be, hogy rájöttek, hogy vehetik rá a rendszert arra, hogy egyszerre több játékot is ismerjen. Ez pedig nagyon fontos lépés lehet a tudástranszfer gépi megvalósítása felé, vagyis annak irányába, hogy a rendszerek az egyik helyzet kapcsán elsajátított ismerteket más szituációkban is alkalmazni tudják.

A tudástranszfer a kíváncsisághoz és a késleltetett jutalmazáshoz hasonló módon olyan koncepció, amelyet az ember erőfeszítések nélkül alkalmaz, a mesterséges rendszerek számára azonban gondokat okoz. A probléma megoldásában ugyanakkor ismét nagyon jól használhatók a videojátékok. Julian Togelius, a New York Egyetem kutatója például kitalált és megrendezett egy jelenleg is folyó versenyt, ahol a résztvevőknek egyetlen programot kell létrehozniuk, amelynek aztán tíz különböző, mind a programozók, mind a szoftver számára ismeretlen játék során kell bizonyítania rátermettségét. Ehhez olyan programokat kell fejleszteni, amelyek rendelkeznek a videojátékok játszásához szükséges alapkészségekkel: tudnak előre tervezni, felfedező kedvűek, döntéseket hoznak és így tovább. És persze ezeket a készségeket olyan helyzetekben is alkalmazni tudják, amelyekkel korábban nem találkoztak.

Ha a tudástranszfert sikerül hatékonyan megoldani, a hétköznapokban hasznosítható mesterséges intelligenciák fejlesztése még ebben az esetben is óriási feladat lesz. Aminek az egyik oka az, hogy a szakértők még nem egészen tudják, hogyan érdemes létrehozni és tanítani az ilyen rendszereket. Az egyik népszerű teória szerint a gépi intelligenciát tudatos tervezés helyett úgy lehet létrehozni, hogy a mesterséges hálózat saját tapasztalataiból tanul, és magától válik intelligenssé.

Már az 1980-as években is léteztek olyan kísérletek, amelyek azt támasztották alá, hogy a robotok tanításának legjobb módja, ha felszerelik ezeket egy csomó szenzorral, és hagyják maguktól mozogni és hibázni őket. Akkoriban azonban még gondot jelentett, hogyan lehet nagyobb méretekben megismételni ezeket a próbálkozásokat. A videojátékok ebben is segíthetnek. Míg a való világban megépített robotok magukra hagyva sok karbantartást igényelnek és drágák, a virtuális robotoknak nincsenek mozgóalkatrészeik. Így nem lesz tényleges bajuk, ha nekiütköznek valaminek, és ha át kell tervezni őket, az sem kerül sokba.

A környezet is megváltoztatható néhány parancs révén, és a számítógép képes arra, hogy párhuzamosan több ezer különböző terepen zajló kísérletet szimuláljon, így nem kell kivárni, amíg a valódi robot lassan megtanulja, amit kell. Ehelyett párhuzamosan egy légiónyi virtuális robot próbálkozik átvergődni valamilyen útvonalon, és a rendszer minden próbálkozásból tanul valamit.

Demis Hassabis, a DeepMind alapítója szerint a másik fontos dolog ezzel kapcsolatban, hogy a virtuális robot nem tud „csalni”. Csak azokat az információkat kapja meg, amelyeket a játék biztosít számára, vagyis ezekből kell következtetéseket levonnia, és boldogulnia. Így pedig sokkal könnyebben ellenőrizhető és elemezhető az is, hogy mi alapján döntött, mint a valóságban, ahol gyakran beláthatatlanul sok faktor játszik szerepet az események alakulásában.

Végső soron persze, ahogy a gyermekek, úgy a virtuális robotok játékának is az a célja, hogy ellenőrzött környezetben készüljenek fel a valóságra, és elsajátítsák azokat stratégiákat, amelyeket később, éles helyzetekben hasznosíthatnak. Ez azonban már a fejlesztés következő lépését jelenti.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

MIT TANULHAT A MESTERSÉGES INTELLIGENCIA A GTA-BÓL?

TOP 5 AZ IPON-ON