Shop menü

ELEKTRONIKUS BÁRÁNY, CSIGAHÁZAS MALAC, KUTYAFEJŰ HAL

Avagy miről álmodnak a Google és a Facebook kutatói által fejlesztett neurális hálózatok.
Jools _
Jools _
Elektronikus bárány, csigaházas malac, kutyafejű hal

1. oldal

A Google által nemrégiben közzétett képek talán választ adhatnak arra a kérdésre, hogy miről álmodnak a gépek. A jelek szerint pszichedelikus tájakról, ahol a legkülönbözőbb mesterséges formák és élőlények olvadnak egymásba. Mind a Facebook, mind a Google gigantikus neurális hálózatokat, vagyis olyan mesterséges agyakat fejleszt, amelyek képesek az arcok, a gépkocsik, az épületek és más objektumok képeken való azonosítására. Ez azonban nem minden.

A rendszerek felismerik a beszélt nyelv szavait, képesek egyik nyelvről a másikra fordítani, célzott reklámokat összerakni vagy megtanítani egy robotot, hogyan csavarja vissza a flakonra a kupakot. És ha ezeket a mesterséges intelligenciákat egy kicsit a fejük tetejére állítjuk, a képek felismerésén túl ők maguk is képessé válnak képek létrehozására. A végeredmény rendkívül érdekes, ugyanakkor egy kicsit nyugtalanító is.

A Facebook néhány nappal ezelőtt hozta nyilvánosságra, hogy neurális hálózatait többek közt arra tanítja, hogy ezek repülők, autók és állatok piciny képeit hozzák létre, és az eredményül kapott ábrázolásokról az esetek 40 százalékában azt fogja hinni az emberi néző, hogy a valóságról készült képeket lát. A rendszer képes megállapítani egy képről, hogy az fényképezőgéppel készült, vagy festéssel, illetve más módon lett előállítva, mondja a Facebook mesterséges intelligenciát kutató szakértője, Rob Fergus. „Érti a képek működési struktúráját.”

A Google kutatói közben ezzel némiképp ellentétes irányt vettek, hiszen ők valódi fényképeket táplálnak be a neurális hálózatokba, amelyek aztán ezeket alakítják át valami egészen fantasztikussá. Ennek érdekében arra tanítják a mesterséges intelligenciákat, hogy ismerős mintázatok után kutassanak a képeken, majd ha ilyenre akadtak, erősítsék fel azokat, majd újra és újra ismételjék meg a procedúrát ugyanazzal a képpel, lassan átalakítva annak részleteit.

Galéria megnyitása

„Visszacsatolási köröket teremtünk: ha a képen az egyik felhő egy kicsit hasonlít egy madárra, a hálózat madárszerűvé fogja alakítani azt” – írják a cég szakértői a projektről szóló blogbejegyzésükben. „A következő körben ennek következtében a hálózat még könnyebben felismeri majd a madarat, és újabb részleteket tesz hozzá a képhez. Ez egészen addig folytatódik, míg látszólag a semmiből elő nem bukkan egy madár rendkívüli módon kidolgozott képe.”

Az alacsonyabb szintű átalakításoknál mindez csak annyit jelent, hogy a képen látható körvonalak detektálásával megbízott hálózat úgy alakítja át a képet, hogy az kifejezetten festményszerű lesz a vonalakból kreált ecsetvonások eredményeként. Ez az átalakítási mód gyakorlatilag még nem több annál, mint amire a Photoshop és más képszerkesztők szűrői képesek.

Galéria megnyitása
Galéria megnyitása

A következő lépés a korábbiakban már említett „állatkeresés”, vagyis amikor komplex alakzatok felkutatására bíztatják a hálózatot. A végeredmény ilyenkor leginkább bizarr hallucinációkra emlékeztet: a képeken kutyafejű halak és csigaházat hordozó malacok tűnnek fel. (Vagyis Philip K. Dick talán nem is állt olyan messze a valóságtól azokkal a bizonyos elektronikus bárányokkal.) A végső szintje a képátalakításnak az az állomás, amikor a rendszer véletlenszerű zajból álló „képekből” kreál alakokat ábrázoló alkotást, mivel ilyenkor olyan formákat emel ki a képből, amelyek teljes mértékben saját képzelete szüleményei.

Galéria megnyitása
Galéria megnyitása

2. oldal

Mind a Google, mind a Facebook próbálkozása több látványos trükknél. Ezek a projektek egészen új módon próbálkoznak a neurális hálózatok működésének továbbfejlesztésével, megalkotóik reményei szerint egyre közelebb hozva ezeket az emberi intelligenciához. És a gépi festmények lévén nagyon látványosan megmutatható, hogy hogyan is áll a fejlesztés, és mit tanultak meg a hálózatok.

A Facebookos projekt érdekessége, hogy a rendszer két neurális hálózatra épül. Az egyik a fotókhoz hasonló képeket hoz létre, a másik pedig megpróbálja kiszűrni ezeket a tényleges fényképek közül. „Egymás kijátszása cél” – mondja Yann LeCun, aki a cég másfél éve üzemelő mesterséges intelligencia laboratóriumát vezeti. „Az egyik hálózat igyekszik átverni a másikat, míg ez utóbbi pontosan ezt az átverést próbálja megakadályozni.” A versengés eredményeként a két hálózat együttesen egyre realisztikusabb „álfotókat” képes létrehozni.

LeCun elmondása szerint ezen neurális hálózatoknak egészen konkrét gyakorlati hasznuk is lehet, hiszen alkalmasak lehetnek a valamilyen okból megrongálódott fotók rekonstruálására. A távolabbi cél azonban a felügyelet nélküli gépi tanulás megvalósítása lenne, amelynek keretében a gépek emberi közreműködés nélkül is képesek önmaguk továbbfejlesztésére. Idővel ezek a rendszerek képesek lesznek arra, hogy emberek által teljesen feldolgozatlan, címkék nélküli fotókat elemezzenek, vagyis pontosan felismerjék az azon ábrázolt objektumokat, és maguk végezzék el a képek osztályozását.

A Facebook és a Google neurális hálózatai mesterséges neuronok egymásra épített rétegeiből állnak, amelyek együttesen dolgoznak a problémák megoldásán. Az ilyen rendszerek működésének bizonyos részletei azonban még tervezőik számára sem egyértelműek, nem mindig tudni például, hogy melyik neurális rétegben milyen tevékenység zajlik, magyarázzák a Google szakértői.

Annyi világosnak tűnik, hogy például a képfelismerő neurális hálókban a tanulási időszakot követően minden réteg eltérő szinten értelmezi a kép részleteit, majd a legfelső réteg összegzi, hogy a rendszer szerint mit is mutat a kép. Az első réteg például csak körvonalakat és határokat keres, míg a második az általánosabb, egyszerűbb formákat, például egy-egy ajtót vagy falevelet próbál felismerni a képen. A legmagasabb szintű réteg ezeket az információkat fogja ötvözni, és az olyan komplex objektumok felismerését végzi, mint amilyen egy épület, vagy egy fa.

Galéria megnyitása

A hálózatok fejreállításával, vagyis a képfelismerő rendszer képalkotásra (illetve képátalakításra) utasításával viszont érthetőbbé válnak ennek a működésnek a részletei is. Annak tanulmányozása révén, hogy a gépi intelligencia mit lát bele egy képbe vagy a véletlenszerű zajba, a szakértők is könnyebben fogalmat alkothatnak a rendszer gondolkodási módjáról. A módszerrel kvalitatív módon megállapítató, hogy az egyes rétegek mennyire elvontan értelmezik a képeket.

A rendszer működésének megértéséhez például arra lehet utasítani a hálózatot, hogy a zajt egy bizonyos módon értelmezze, például hozza ki egy banán képét a folyamat végére, mondják a szakértők. Ahogy aztán ez az átrajzolás zajlik, a kutatók is képet kapnak arról, hogy mire gondol a neurális hálózat, amikor a banán szóval találkozik, és hogy milyen képi elemekből tud erre asszociálni. Egyúttal az is vizualizálhatóvá válik, hogy a rendszeren belül hogyan osztódnak fel és kerülnek elvégzésre az egyes feladatokat, ennek ismerete pedig jobb hálózatok kiépítéséhez vezethet. És persze az is könnyebben ellenőrizhetővé válik, hogy mit tanult meg a hálózat az előző „tréning” során.

Galéria megnyitása

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére