Kosár

A kosár jelenleg üres

Bejelentkezés &
Regisztráció

Jelenleg nincs belépve.

Válassza ki az oldal nyelvét

TERMÉKEINK

iPon FÓRUM

iPon Cikkek

A DeepMind rendszere legyőzte Európa legjobb gójátékosát

  • Dátum | 2016.01.31 10:01
  • Szerző | Jools
  • Csoport | EGYÉB

Jelentős eredményt hoztak nyilvánosságra a héten a mesterséges intelligenciák kutatásának területén, a Google tulajdonában lévő DeepMind rendszere ugyanis legyőzte a gó nevű játékban a legutóbbi három Európa-bajnokság győztesét, a kínai születésű, francia színekben szereplő Fan Huit. A hír azért különösen érdekes, mert a stratégián és intuíción alapuló ősi táblás játék évtizedek óta rendre kifogott az intelligens rendszereken dolgozókon.

Az utóbbi években csaknem minden olyan játékban sikerült az legjobb emberi játékosokat legyőző gépeket alkotni, amelyeket az intelligencia fokmérőinek tekintünk, ide értve a sakkot, a Scrabble-t, a reversit és a tévés Jeopardyt is. A gó azonban, amely a hozzáértők szerint a sakknál is összetettebb játék, mostanáig emberi uralom alatt maradt. Néhány nem a Google alkalmazásában álló mesterséges intelligencia szakértő még néhány hete is azon a véleményen volt, hogy még egy jó darabig nem kerül sor arra, hogy egy számítógép megverjen egy vezető gójátékost.

A Google által 2014-ben 400 millió dollárért megvásárolt DeepMind kutatói azonban meglépték, amit sokan lehetetlennek hittek. A várva várt mérkőzésre tavaly októberben került sor a cég londoni székhelyén. Ennek során a DeepMind rendszere, az AlphaGo egymás után öt alkalommal győzte le a kontinens legjobbját. A mérkőzésnek tanúja volt a Nature egyik szerkesztője és a Brit Gószövetség egy képviselője is. „Karrierem legizgalmasabb pillanatait éltem át, mind kutatóként, mind újságíróként” ‒ emlékszik vissza Tanguy Chouard, a Nature szerkesztője az eseményre.


A héten a Nature oldalain megjelent egy tanulmány, amely részletesen beszámol a DeepMind rendszerének működéséről, és arról, hogyan volt képes a gép a győzelemre. Az AlphaGo legnagyobb fegyvere az úgynevezett mélytanulás (deep learning). A fejlesztők 30 profi gójátékos összesen 30 millió lépését táplálták be a rendszerbe, ez azonban csak a projekt kezdeti lépése volt. A következő fázisban annak érdekében, hogy a gép jobb legyen bármilyen emberi játékosnál, megkezdődtek az „edzések”. Az AlphaGo ezek során saját maga ellen játszott, és közben új lépéskombinációkat ötlött ki, amelyek aztán elősegítették az emberi játékos legyőzését.

Az AlphaGo tehát jóval több egy méretes adatbázisánál, amely gondosan felépített szabályok alapján alkalmazza a beletáplált lépéseket. A fejlesztés egy olyan jövő felé vezet, amelyben a való világban mozgó robotok élesben lesznek képesek új feladatokat elsajátítani, és a környezet változásaira is reagálni tudnak. A DeepMind persze nem az cég, amely ezen dolgozik, a Google, a Facebook és a Microsoft online szolgáltatásai már jelenleg is alkalmazzák a mélytanulást, hogy képeket, szavakat és egyéb információkat ismerjenek fel.

Demis Hassabis, a DeepMind alapítója szerint a gépi tanulás a tudományos kutatásokat is előrelendítheti. A szakértő úgy véli, hogy néhány év múlva a kutatók mesterséges intelligenciákkal együttműködve fognak dolgozni, ami egyrészt megkönnyítheti az adatfeldolgozást és gyorsabbá teheti az elemző munkát, másrészt a gépek a következő lépésekre is javaslatokat tehetnek, segítve az emberi szakértőket a tudományos áttörések felé vezető úton.

A góeredményre visszatérve, a megmérettetésnek még nincs vége, ami az AlphaGo-t illeti. Fan Hui zárt ajtók mögött történt legyőzése után Hassabis és csapata most egy nyílt mérkőzés megszervezésén munkálkodik. A március közepére tervezett találkozón a világ egyik legsikeresebb játékosával, Lee Sedollal fog megmérkőzni a gép Dél-Koreában.


Az AlphaGo októberi sikerét megelőzően a legnagyobb győzelmet emberi játékos ellen 2014 elején Rémi Coulom gószoftvere, a Crazystone érte el, amely egy japán versenyen legyőzte Yoda Norimotót. Ez a mérkőzés azonban nem volt teljesen kiegyenlített, hiszen a gép négy lépéses előnyt kapott induláskor, ami igen jelentősnek számít. Coulom az esemény után azt nyilatkozta, hogy még legalább tíz év kell ahhoz, hogy egy gép egy teljesen fair meccsen legyőzzön egy élvonalbeli játékost.

A gó nehézsége a játék természetében rejlik, ugyanis a leghatalmasabb szuperszámítógépek sem rendelkeznek elegendő számítási kapacitással ahhoz, hogy két lépés között minden lehetséges következő lépés következményeit elemezzék. Amikor a Deep Blue 1997-ben legyőzte a sakkvilágelső Garri Kaszparovot, pontosan ezt tette. Az IBM szuperszámítógépe minden potenciális lépést elemzett, így előrébb látott, mint amire az emberi játékos képes volt. A góban ugyanez még ma sem lehetséges, míg ugyanis a sakkban alkalmanként átlagosan 20 lépési lehetőség kínálkozik, a 19x19-es táblán játszott, területfoglalásra törő góban ugyanez a szám 200 körüli, és a 200 közül lépés mindegyik további 200 lehetőséget von maga után. Jelenleg nem létezik olyan mesterséges rendszer, amely emberi idő alatt képes lenne ennyi opciót ellenőrizni.

Olyan heurisztikus keresőalgoritmusok révén, mint amilyen a Monte Carlo-fakeresés, a Crazystone és társai persze számítási kapacitásukhoz képest meglepően sok lépést képesek előre látni. Különböző módszerekkel lehetséges csökkenteni a potenciális lépéssorok számát, így ezek a rendszerek végül alkalmassá váltak néhány nagyon jó gójátékos legyőzésére, a legjobbakkal azonban nem boldogultak. A nagymesterek játéka ugyanis nagyon nagy mértékben intuíción alapul, mivel a világ legjobbjai nem az egyes lépéseket elemezve hozzák meg döntésüket a folytatásról, hanem a tábla átfogó kinézete alapján. „A jó pozíciók jól is mutatnak” ‒ mondja Hassabis, aki maga is aktív gójátékos. „Különös esztétikum jellemzi ezt a játékot, amely pontosan ezért tudott olyan izgalmas maradni az évezredeken keresztül.”

Hozzászólások

Nem vagy bejelentkezve, a hozzászóláshoz regisztrálj vagy lépj be!

Eddigi hozzászólások:

  • 15.
    2016. 05. 17. 12:24
    Sokkal több lehetséges játékállás van Go-ban, mint amennyi atom az univerzumban.
    10^170 vs 10^80

    Persze, determinisztikus, könnyen értelmezhető játék, de egyáltalán nem lehet brute force-al a lehetséges lépéseknek még a töredékét sem kiszámolni.

    A program intuíciót használt fel, saját hibáiból és az ellenfél stílusából tanult, ami hatalmas teljesítmény.
  • 14.
    2016. 03. 16. 02:18
    "Akkor most miről beszélünk?"

    https://hu.wikipedia.org/wiki/Nim

    "Sajnos nem találom azt a videót amikor a 2000-es évek körül az akkor legokosabb ~3000 ELO-s sakk programot a program tervezője 10 lépésben megvert."

    Ezt nem tudom, mire kéne vélnem. Egy ~3000 ELO-s gépet nem lehet 10 (10-10?) lépésben megverni.

    (azok nem adják fel tiszthátrány esetén, ugye? (a goprogram feladja, mondjuk az kegyetlen unalmas lenne, ha végig kéne játszani))

    Egyébként, simán elképzelhető, hogy vannak lokális jó lépések a sakkon (és a gón) belül, amiket külön el kell magyarázni a gépnek, mert az algoritmusa nem szűri ki.

    Mindazonáltal annyira hihetetlennek hangzik ez a történet, hogy nem hiszem el
  • 13.
    2016. 02. 06. 20:45
    Persze, hogy drámaibb legyen a hatás.
  • 12.
    2016. 02. 05. 14:47
    Javaslom megnézésre a Csodálatos elme című filmet, ott Russel Crowe is pontosan így gondolkodik, még is veszít
  • 11.
    2016. 02. 03. 08:24
    Fogadjunk, hogy nem olvastad a cikket. Ez már abból is jól látszik, hogy hírnek nevezed.

    u.i. Mellesleg a go pont azért nem egyszerű feladat, mert a "számítógép" nem képes a kvázi végtelen lehetőséget előre kiszámolni. A go intuitív játék, intuíciót pedig viszonylag nehéz programozni. Ami a mostani áttöréshez kellett, hogy a gép képes legyen önállóan tanulni és jobbá válni, mint az ellenfele. Ez a mesterséges intelligenciának egy olyan területe volt, amiben eddig az ember sokkal jobb volt.
  • 10.
    2016. 02. 02. 16:37
    Pont, hogy a Go-ban aki kezd az n helyre rakhatja le az első bábuját, a második fél már csak n-1-re, és ezt az előnyt a kezdő játékos mindvégig megtartja. Ergo a második fél jó pár millió lépésvariáció hátránnyal játszik.
    Akkor most miről beszélünk?

    "Legyőzték az embert sakkban, soha nem fogja ember legyőzni sakkban a programot."

    Sajnos nem találom azt a videót amikor a 2000-es évek körül az akkor legokosabb ~3000 ELO-s sakk programot a program tervezője 10 lépésben megvert.
  • 9.
    2016. 02. 02. 16:32
    Semmi érdekes nincs ebben a hírben, egy számítógép alig egy másodperc alatt képes minden lehetséges variációt és következményt kiszámolni tehát nem tartom nagy számnak ha legyőzi az embert. Találkoztam már olyan amőba játékkal amiben egyszerűen nem lehetett győzni a gép ellen. A rubik kockát is kirakják szempillantás alatt tehát nincs min csodálkozni.
  • 8.
    2016. 02. 02. 16:11
    "A sakk algoritmusok kb egy idősek a számítógéppel, ezzel a játékkal meg még nem foglalkoztak annyi ideje ezért volt az ember veretlen."

    Tudtommal a go-nak sokkal több szintje (értsd versenyzői szintje) van mint a sakknak, ami azt is jelzi, hogy sokkal összetettebb, sokkal több lépésben lesz valaki 'nagymester'.

    "Az meg a másik, hogy a körökre osztott játékokban ha tökéletesen játszol, mindig is az fog nagyobb eséllyel nyerni aki kezd."

    Ugye simán elképzelhető olyan játék, ahol a kezdő van vesztő pozícióban (hadd ne kelljen egyszerű példákat hoznom). Arról nem is beszélve, hogy az általad emlegetett tökélese játék azt sejteti, hogy minden lépés minden végkimenetelét végiggondolja a gép, ami azért a go esetében sokáig nem lesz még így.

    Összességében a hozzászólásod tartalmi minősége nem indokolja, hogy mások beírását baromságnak tituláld.
  • 7.
    2016. 02. 02. 08:35
    Te biztos hogy nyerek01 üzenetére akartál válaszolni?
    Ha igen, az első mondatod baromság, a második irreveláns. A harmadik meg pont azt erősíti meg, amit nyerek01 állít.
  • 6.
    2016. 02. 01. 23:01
    Fatális baromság.

    A sakk algoritmusok kb egy idősek a számítógéppel, ezzel a játékkal meg még nem foglalkoztak annyi ideje ezért volt az ember veretlen.

    Az meg a másik, hogy a körökre osztott játékokban ha tökéletesen játszol, mindig is az fog nagyobb eséllyel nyerni aki kezd.
  • 5.
    2016. 01. 31. 18:08
    Kezdhetünk félni?
  • 4.
    2016. 01. 31. 16:55
    ha új lépéskombinációkat talált ki akár beírhatja a rakéta indító kódokat is
    vagy átállhat terminátor gyártásra is
  • 3.
    2016. 01. 31. 16:34
    értem én, csak az, hogy sakkban, meg góban legyőzi, az - a mögötte lévő fejlesztési munkát értékelve persze - egy jó nagy nudli ahhoz viszonyítva amit az emberi agy tud.

    főleg ha hozzávesszük hogy mindez az emberissség meggazdagabb történelmi periódusában történt, aminél elég nagy eséllyel csak szegényebb periódus lesz
  • 2.
    2016. 01. 31. 14:39
    Amikor a gép legyőzni valamiben az embert akkor onnantól kezdve jobb nála, és ez nem változik. Legyőzték az embert sakkban, soha nem fogja ember legyőzni sakkban a programot. Ezt általánositsd, itt nincs oda-vissza játszma, adok-kapok stb. Egyszer jobbak valamiben és örökre igy is marad. Csak fejlődik...
  • 1.
    2016. 01. 31. 13:56
    sakk: 8x8, néhány bit per mező
    go: kb 20x20, néhány bit per mező
    szabályok: viszonylag egyszerű természeti törvények mindkét játékban

    persze, nagy teljesítmények ezek a számítógépek, és a programok, de egy x*x mezős kis egyszerű világokban történő eseményekről van szó mindkettőben... hol van ez a világhoz képest?