Számtalan olyan egészségügyi állapot létezik a torokráktól a paralízisig, amely megfosztja az embert a beszéd képességétől, megnehezítve számára a kommunikációt. Erre a problémára keresnek megoldást a Kaliforniai Egyetem kutatói, akik egy olyan dekóderen dolgoznak, amely az agyi aktivitást közvetlenül szintetikus beszéddé fordítja, hangot adva az elnémult betegeknek.
A beszédképtelen betegek gyakran jelenleg is agy–számítógép-interfészekre vagy szem-, illetve fejmozgásukat követő készülékekre támaszkodnak, hogy kommunikálni tudjanak. A tavaly elhunyt Stephen Hawking például arcizmaival mozgatott egy kurzort, így vezérel szintetikus hangját. A probléma, hogy ezen rendszerek többségével betűről betűre kell „bepötyögni” a szavakat, ami általában csak 5–10 szó generálását teszi lehetővé percenként. A normál beszéd ennél sokkal gyorsabb, az angol anyanyelvűek átlagosan 120–150 szót, a magyar köznyelvi beszélők pedig 100–120 szót mondanak ki percenként.
Edward Chang és kollégái egy olyan rendszert akartak létrehozni, amely hasonlóan gyors beszédszintetizálást tesz lehetővé. Ehhez elektródákat helyeztek a résztvevők agyának azon területére, amely a hangképző rendszer hangszalagok feletti részeit, vagyis a toldalékcső elemeit vezérli, így többek közt a nyelvet, az ajkakat, az állkapcsot és a garatüreget koordinálja. A szakértők által kifejlesztett rendszer ezen terület aktivitását fordítja le beszédhangokká.
Ehhez a kutatócsoport tagjai először olyan epilepsziás betegektől gyűjtött adatokra támaszkodtak, akiknek agyában beültetett elektródák monitorozzák az aktivitást, többek közt a kérdéses terület működését is. Majd az adatokat egy gépi tanulásra képes program betanítására használták, hogy az képes legyen az aktivitásmintázatokból teljes mondatokat szintetizálni.
Végül kipróbálták a rendszert néhány beszédképes önkéntesen, és a szintetizált hanganyagokat az Amazon Mechanical Turk-ön toborzott résztvevőkön tesztelték. A hallgatóság az esetek 43 százalékában értette meg, mit mondott a szintetikus hang, amikor 25 előre megadott szóból kellett választaniuk, és 21 százalékban, amikor 50 szó volt megadva előre. Bár a módszer egyelőre mérsékelten érthető beszédet produkál, már jelenlegi formájában is óriási változásokat hozhat egy olyan beteg életében, akinek nem nagyon van módja másként kommunikálni. A rendszer ráadásul az adott betegre „edzve” egyre pontosabbá válhat, így gyakorlással egyre több szót tud érthetően közvetíteni, mondják a fejlesztők.
Chang ugyanakkor hangsúlyozza, hogy a módszert egyelőre csak beszédképes résztvevőkön tesztelték, így azoknál, akik nem tudnak beszélni, hosszabb időbe telhet, amíg érthető szavakat tud generálni a rendszer. Különösen abban az esetben, ha az illető sosem tanult meg beszélni. A szakértő azt is hozzáteszi, hogy a módszer „gondolatolvasásra” nem alkalmas: csak azokat az agyi jeleket fordítja szavakká ugyanis, amelyek a hangképzésre irányulnak.