A generatív AI és a nagy nyelvi modellek körül szinte forr a levegő, olyannyira népszerű mindkét téma manapság, ami nem is olyan nagy meglepetés, hiszen a jelenlegi hardverekkel végre kellően nagy teljesítmény áll rendelkezésre ahhoz, hogy a különböző algoritmusok és nagy nyelvi modellek fejlesztése zökkenőmentesebb lehessen.
Az AI-ban lapuló lehetőségek meglehetősen izgalmasak, hiszen számos olyan dolgot tesznek lehetővé, amit korábban nem, vagy csak nehézkesen, kevésbé pontosan lehetett megoldani. Ilyen például a gondolatokkal, pontosabban agyhullámokkal történő eszközvezérlés és kommunikáció is: a GrapheneX-UTS (University of Technology Sydney) Human-Centric Artificial Intelligence Centre kutatói pont ezen a területen értek el érdekes eredményeket a minap.
Az agyhullámok érzékelése és feldolgozása az AI segítségével gyorsabban, pontosabban is hatékonyabban megoldható, mint a korábbi módszerekkel, ráadásul a technológia a Musk-féle Neuroalinkkel ellentétben „nem-invazív” módon, azaz implantátumok alkalmazása nélkül működik. Használatához csak egy EEG sapkát kell a delikvens fejére húzni, amely egy multitasking-képes EEG enkóderrel is rendelkezik. A cél az, hogy az agyhullámok érzékelésével és feldolgozásával szöveget vagy beszédet nyerjen ki a rendszer, méghozzá egy speciálisan tréningezett neurális hálózat alkalmazásával (AI), ami segít a hullámformákat szöveggé konvertálni, ezt a szöveget pedig beszéddé is lehet alakítani.
A kutatók 29 különböző személyen tesztelték a rendszer működését, és a tapasztalatok alapján úgy tűnik, maga a technológia nem csak egy embernél működőképes, hanem többeknél is. Ez azért is különösen fontos, mert az EEG (Elektroenkefalográfia) hullámok minden egyes személynél eltérőek.
A szóban forgó kísérletnél először használta diszktréd kódoló technikákat az agyhullámok szöveggé történő alakítása során, ezzel egy innovatív megközelítést vezettek be a neurális dekódolás területére. Azzal, ha a módszert nagy nyelvi modellekkel is kombinálják, sok új lehetőség előtt nyílnak meg a kapuk az idegtudomány és az AI területén. Egy ilyen sisakkal a fejünkön persze nagyon vigyázni kell majd arra, mire is gondolunk éppen, mert „kihallatszik"...
A technológiát rengeteg dologra lehet használni, természetesen akár rosszra is. A jó felhasználási módok között szerepelhet mindazon betegek segítése, akik beszédközpontjuk ideiglenes vagy tartós sérülése miatt nem tudnak szóban kommunikálni, de a módszer az ember és a gép közötti kommunikációban is fontos szerephez juthat. Az eljárás ugyanakkor kreatív munkák során is jól jöhet, hiszen növelheti a produktivitást: a gondolatokat szavakká formáló rendszer gyorsabb lehet, mint a gépelés vagy az írás.
Noha a módszer meglehetősen ígéretes és izgalmas, messze van még a tökéletestől. A „kezdetleges” neurális hálózat egyelőre elég sok hibát követ el az agyhullámok szöveggé való átalakítása során, sok a félreértés a szavak megformálásakor, így további tréningezésre lesz szükség, hogy a szövegkörnyezet alapján pontosabb lehessen a szavak felismerése és beillesztésük is.
Egyelőre problémák vannak a pontossággal is, hiszen a rendszer hatásfoka jelenleg 40% körül helyezkedik el, ám ezt a csapat szerint idővel akár 90%-ra is növelhetik. A neurális hálózat a főnevek esetében hajlamos oda nem illő szinonim párok használatára is. Például akkor, ha egy EEG agyhullám a „szerző” szóra utal, a neurális hálózat hajlamos helyette a „személy” szót használni. Ez persze nem egy nagy meglepetés, hiszen a technológia még gyerekcipőben jár, elnézhetőek a botladozások, idővel úgyis egyre pontosabbá válhat, ahogy tovább tréningezik.