Szöveggé és beszéddé alakítja a gondolatokat egy új AI fejlesztés

SZÖVEGGÉ ÉS BESZÉDDÉ ALAKÍTJA A GONDOLATOKAT EGY ÚJ AI FEJLESZTÉS

Az újítás nem-invazív módszerrel nyeri ki az agyhullámokat, majd AI segítségével alakítja őket szöveggé, ebből később pedig beszéd is készülhet.

Víg Ferenc (J.o.k.e.r)

A generatív AI és a nagy nyelvi modellek körül szinte forr a levegő, olyannyira népszerű mindkét téma manapság, ami nem is olyan nagy meglepetés, hiszen a jelenlegi hardverekkel végre kellően nagy teljesítmény áll rendelkezésre ahhoz, hogy a különböző algoritmusok és nagy nyelvi modellek fejlesztése zökkenőmentesebb lehessen.

Az AI-ban lapuló lehetőségek meglehetősen izgalmasak, hiszen számos olyan dolgot tesznek lehetővé, amit korábban nem, vagy csak nehézkesen, kevésbé pontosan lehetett megoldani. Ilyen például a gondolatokkal, pontosabban agyhullámokkal történő eszközvezérlés és kommunikáció is: a GrapheneX-UTS (University of Technology Sydney) Human-Centric Artificial Intelligence Centre kutatói pont ezen a területen értek el érdekes eredményeket a minap.

Az agyhullámok érzékelése és feldolgozása az AI segítségével gyorsabban, pontosabban is hatékonyabban megoldható, mint a korábbi módszerekkel, ráadásul a technológia a Musk-féle Neuroalinkkel ellentétben „nem-invazív” módon, azaz implantátumok alkalmazása nélkül működik. Használatához csak egy EEG sapkát kell a delikvens fejére húzni, amely egy multitasking-képes EEG enkóderrel is rendelkezik. A cél az, hogy az agyhullámok érzékelésével és feldolgozásával szöveget vagy beszédet nyerjen ki a rendszer, méghozzá egy speciálisan tréningezett neurális hálózat alkalmazásával (AI), ami segít a hullámformákat szöveggé konvertálni, ezt a szöveget pedig beszéddé is lehet alakítani.

A kutatók 29 különböző személyen tesztelték a rendszer működését, és a tapasztalatok alapján úgy tűnik, maga a technológia nem csak egy embernél működőképes, hanem többeknél is. Ez azért is különösen fontos, mert az EEG (Elektroenkefalográfia) hullámok minden egyes személynél eltérőek.

A szóban forgó kísérletnél először használta diszktréd kódoló technikákat az agyhullámok szöveggé történő alakítása során, ezzel egy innovatív megközelítést vezettek be a neurális dekódolás területére. Azzal, ha a módszert nagy nyelvi modellekkel is kombinálják, sok új lehetőség előtt nyílnak meg a kapuk az idegtudomány és az AI területén. Egy ilyen sisakkal a fejünkön persze nagyon vigyázni kell majd arra, mire is gondolunk éppen, mert „kihallatszik"...

A technológiát rengeteg dologra lehet használni, természetesen akár rosszra is. A jó felhasználási módok között szerepelhet mindazon betegek segítése, akik beszédközpontjuk ideiglenes vagy tartós sérülése miatt nem tudnak szóban kommunikálni, de a módszer az ember és a gép közötti kommunikációban is fontos szerephez juthat. Az eljárás ugyanakkor kreatív munkák során is jól jöhet, hiszen növelheti a produktivitást: a gondolatokat szavakká formáló rendszer gyorsabb lehet, mint a gépelés vagy az írás.

Noha a módszer meglehetősen ígéretes és izgalmas, messze van még a tökéletestől. A „kezdetleges” neurális hálózat egyelőre elég sok hibát követ el az agyhullámok szöveggé való átalakítása során, sok a félreértés a szavak megformálásakor, így további tréningezésre lesz szükség, hogy a szövegkörnyezet alapján pontosabb lehessen a szavak felismerése és beillesztésük is.

Egyelőre problémák vannak a pontossággal is, hiszen a rendszer hatásfoka jelenleg 40% körül helyezkedik el, ám ezt a csapat szerint idővel akár 90%-ra is növelhetik. A neurális hálózat a főnevek esetében hajlamos oda nem illő szinonim párok használatára is. Például akkor, ha egy EEG agyhullám a „szerző” szóra utal, a neurális hálózat hajlamos helyette a „személy” szót használni. Ez persze nem egy nagy meglepetés, hiszen a technológia még gyerekcipőben jár, elnézhetőek a botladozások, idővel úgyis egyre pontosabbá válhat, ahogy tovább tréningezik.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

SZÖVEGGÉ ÉS BESZÉDDÉ ALAKÍTJA A GONDOLATOKAT EGY ÚJ AI FEJLESZTÉS

TOP 5 AZ IPON-ON