Shop menü

ÁTLAGOSAN 28 MOZDULATBÓL RAKJA KI A RUBIK-KOCKÁT EGY ÚJ RENDSZER

A Kaliforniai Egyetem kutatói által fejlesztett mesterséges intelligencia semmiféle előzetes emberi segítséget nem kapott a rejtvényhez, de így is megdöbbentő sebességgel és hatékonysággal oldotta meg a feladatot.
Jools _
Jools _
Átlagosan 28 mozdulatból rakja ki a Rubik-kockát egy új rendszer

A múlt heti pókerező mesterséges intelligencia után máris itt a szakterület újabb mérföldköve, a Rubik-kockával játszó DeepCubeA, amely nemcsak arra képes, hogy bármilyen összekevert kockát kirakjon, hanem mindezt az esetek 60 százalékában a lehető legkevesebb mozdulattal teszi meg. A rendszer átlagosan 28 mozdulattal oldja meg a feladatot, 1,2 másodperc alatt számítva ki a megoldást.

Ez meglehetősen gyorsnak hangzik, azonban az elmúlt években készültek olyan mesterséges rendszerek, amelyek ennél is gyorsabbak. Egy tavaly bemutatott robotnak (amely az alábbi videón látható) például mindössze 0,38 másodperc kell a megoldáshoz. Ez és a többi gyorsabb rendszer azonban specifikusan erre az egy feladatra készült, és emberek által írt algoritmusokat használ a hatékony megoldás megtalálásához. A DeepCubeA viszont magát tanította megerősítéses gépi tanulással arra, hogyan érdemes nekilátni a feladatnak.

Pierre Baldi, az eredményekről beszámoló tanulmány egyik szerzője szerint a Rubik-kocka és a sakk, illetve a gó között az az alapvető eltérés, hogy az előbbi megoldásához erősebb szimbolikus, matematikai és elvont gondolkodásra van szükség. Így aztán az a rendszer, amely képes kirakni a kockát, egy nagy lépéssel közelebb áll a gondolkodó, érvelő, tervező és döntéshozó gépekhez a sakkozó mesterséges intelligenciáknál.

A megerősítéses tanulás lényege, hogy a rendszer pontokat kap, ha sikeres stratégiát vagy lépést alkalmaz, és pontot veszít, ha rosszul választ. Ezzel a motivációval a rendszer az idő múlásával egyre jobb lesz, mindenféle emberi beavatkozás nélkül is. A Rubik-kocka esetében ez az út ígéretesnek tűnt, a 3x3x3-as játék ugyanis több mint 43 trillió módon rendezhető el, így véletlenszerű próbálkozásokkal és az összes lehetőség végigpörgetésével a világ legnagyobb szuperszámítógépe sem tudja megoldani azt.

A Kaliforniai Egyetem kutatóinak korábbi mesterséges intelligenciája, a DeepCube még hagyományosabb útkereső módszerekkel és a DeepMind AlphaZero rendszerénél alkalmazott megerősítéses tanulással fejlődött. Míg azonban ez a módszer a két játékosos táblajátékoknál bevált, a Rubik-kocka megoldása során nagyon nehézkesnek bizonyult. A tesztek alatt a DeepCube egyszerűen túl sok ideig gondolkodott a megoldáson, amely ráadásul sok esetben nagyon messze volt a tökéletestől.

Galéria megnyitása

A DeepCubeA esetében ezért a szakértők más megoldás után néztek. A rendszer egy kirakott kockával kezdett játszani, véletlenszerű mozdulatokkal keverve össze azt, gyakorlatilag azt tanulva meg, hogyan játszhatja a Rubik-kocka kirakásának fordítottját. Először néhány mozdulat után megállt, ahogy azonban a tanulás folytatódott, az összekeverések egyre összetettebbek lettek. A rendszer összesen 10 milliárdszor keverte össze a kockát 2 nap alatt.

A tanulási periódus után a DeepCubeA azt a feladatot kapta, hogy rakjon ki 1000 véletlenszerűen összekevert kockát kevesebb mint 30 mozdulattal. A rendszer minden esetben kirakta a kockát, és 60,3 százalékban a lehető legrövidebb idő alatt sikerült ez neki. Ahogy már említettük, az átlaga 28 mozdulat volt – összevetésképpen a legjobb emberi játékosok nagyjából 50 lépésben rakják ki a kockát.

Érdekes az is, hogy milyen stratégiát alkalmaz a rendszer. Bár ennek matematikai megfejtése nem volt a kutatás célja, az nyilvánvalónak tűnik, hogy míg az emberi játékosok stratégiája viszonylag könnyen, lépésről lépésre elmagyarázható, a DeepCubeA módszere emberi szemmel egyáltalán nem nyilvánvaló, mondja Forest Agostinelli, a kutatócsoport tagja.

Galéria megnyitása

A DeepCubeA, ahogy a korábbiakból már kiderülhetett, nem egy egyetlen feladatra fejlesztett rendszer, hanem más komplex problémák megoldására is alkalmas lehet. Ennek demonstrálására a szakértők más játékok esetében is bevetették, és a Rubik-kockázáshoz hasonló hatékonysággal tanult meg tologatós puzzle játékokat, a Lights Out nevű játékot, és a labirintusban doboztologatásból álló szókobant játszani.

A szakértők mindezek alapján úgy vélik, hogy a rendszer apróbb módosításokkal rövidesen olyan területeken is bevethető lehet, mint például a fehérjeszerkezetek előre jelzése, ami nagyon hasznos lehet a gyógyszerfejlesztés során, illetve a robotok útvonalának megtervezésében is segíthet összetett környezetekben.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére