Magától tanul szövegértést egy gép

Immár közel kilenc hónapja olvasgatja magában a netet egy számítógép a Carnegie Mellon Egyetem pincéjében, elemezve és tanulva az angol nyelv rejtelmeit - és minél többet tud, annál gyorsabban halad, annál könnyebben tanul még többet.

Magától tanul szövegértést egy gép

Immár közel kilenc hónapja olvasgatja magában a netet egy számítógép a Carnegie Mellon Egyetem pincéjében, elemezve és tanulva az angol nyelv rejtelmeit - és minél többet tud, annál gyorsabban halad, annál könnyebben tanul még többet.

A gép a NELL, avagy Never-Ending Language Learning (= örök nyelvtanuló) nevet viseli, és az egyetem kutatói mellett részt vállalt belőle a Yahoo (biztosítva a szuperszámítógép-hátteret), valamint a Google és a DARPA is (anyagi támogatással).

A projekt célja értelemszerűen egy olyan gép kifejlesztése, amely önmagában is tudja értelmezni az emberi nyelvet. A rendszer több százmillió oldalt nyálaz át, gyűjti a "tényeket", 280 különböző kategóriába (mint pl. városok, növények, színészek, stb.) rendszerezve őket. Eddig 400.000 ilyen tényt gyűjtött össze, 87%-os pontossággal rakva őket a megfelelő helyre.

A begyűjtött adatokat nyelvtanilag is elemzi, tanulmányozza a kifejezéseket és a szószerkezeteket, hogy minél jobban megérthesse, melyik miről szól (eddig 280 viszonykifejezést ismert fel és tanult meg). Ha pl. a "Pikes Peak" (Pikes-hegy, ill. szó szerint Pikes-csúcs; a "peak" azonban az angolban sok mindent jelenthet, így elsőre nem feltétlenül lesz egyértelmű a gépnek pusztán a szavak vizsgálatával, hogy miről van szó) kifejezéssel találkozik, akkor egyrészt feljegyzi, hogy mindkettő nagy betűvel kezdődik (ez már önmagában is valószínűsítheti a földrajzi nevet), másrészt pedig a biztonság kedvéért átnéz más kifejezéseket is, amelyekben szerepel ez a szókapcsolat, és ha rendszeresen talál ezeknél olyat, mint pl. hogy "megmásztam", akkor már valóban biztos lehet benne, hogy ez bizony egy hegy.

Természetesen más szavakkal és kifejezésekkel ugyanígy megbirkózik bármilyen szövegkörnyezetben - még ha néha mellé is lő; az "internet cookies"-t például pékáruként kategorizálta be magának más, ahhoz tartozó kifejezésekkel, így például a "computer files"-szal együtt. Ilyen esetekben a kutatók egyszerűen javítják a tévedést, és hagyják tovább dolgozni a gépet. Mint mondják, az ember is így sajátítja el a nyelvet: ha hibázik, kijavítják, így már tudhatja, hogy az hogyan van helyesen, és tanulhat tovább.

Ez a projekt már csak azért is különösen érdekes, mivel ha sikerrel járnak, az például egy olyan keresőt is eredményezhetne, aminek megszokott, hétköznapi módon fogalmazva tehetnénk fel kérdéseket, és "ő" linkek helyett valódi válaszokat tudna összeszedni és prezentálni azokra - de hasonlóképp vezényelhetnénk a gép szinte bármely egyéb funkcióját is egyszerűen úgy, hogy megmondjuk neki, hogy mit csináljon.

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward