Gondolatokból generál beszédet egy újfajta készülék

A fejlesztés minőségi változást hozhat a beszédképtelen betegek életébe.

Gondolatokból generál beszédet egy újfajta készülék

Számtalan olyan egészségügyi állapot létezik a torokráktól a paralízisig, amely megfosztja az embert a beszéd képességétől, megnehezítve számára a kommunikációt. Erre a problémára keresnek megoldást a Kaliforniai Egyetem kutatói, akik egy olyan dekóderen dolgoznak, amely az agyi aktivitást közvetlenül szintetikus beszéddé fordítja, hangot adva az elnémult betegeknek.

A beszédképtelen betegek gyakran jelenleg is agy–számítógép-interfészekre vagy szem-, illetve fejmozgásukat követő készülékekre támaszkodnak, hogy kommunikálni tudjanak. A tavaly elhunyt Stephen Hawking például arcizmaival mozgatott egy kurzort, így vezérel szintetikus hangját. A probléma, hogy ezen rendszerek többségével betűről betűre kell „bepötyögni” a szavakat, ami általában csak 5–10 szó generálását teszi lehetővé percenként. A normál beszéd ennél sokkal gyorsabb,  az angol anyanyelvűek átlagosan 120–150 szót, a magyar köznyelvi beszélők pedig 100–120 szót mondanak ki percenként.

Edward Chang és kollégái egy olyan rendszert akartak létrehozni, amely hasonlóan gyors beszédszintetizálást tesz lehetővé. Ehhez elektródákat helyeztek a résztvevők agyának azon területére, amely a hangképző rendszer hangszalagok feletti részeit, vagyis a toldalékcső elemeit vezérli, így többek közt a nyelvet, az ajkakat, az állkapcsot és a garatüreget koordinálja. A szakértők által kifejlesztett rendszer ezen terület aktivitását fordítja le beszédhangokká.

Ehhez a kutatócsoport tagjai először olyan epilepsziás betegektől gyűjtött adatokra támaszkodtak, akiknek agyában beültetett elektródák monitorozzák az aktivitást, többek közt a kérdéses terület működését is. Majd az adatokat egy gépi tanulásra képes program betanítására használták, hogy az képes legyen az aktivitásmintázatokból teljes mondatokat szintetizálni.

Végül kipróbálták a rendszert néhány beszédképes önkéntesen, és a szintetizált hanganyagokat az Amazon Mechanical Turk-ön toborzott résztvevőkön tesztelték. A hallgatóság az esetek 43 százalékában értette meg, mit mondott a szintetikus hang, amikor 25 előre megadott szóból kellett választaniuk, és 21 százalékban, amikor 50 szó volt megadva előre. Bár a módszer egyelőre mérsékelten érthető beszédet produkál, már jelenlegi formájában is óriási változásokat hozhat egy olyan beteg életében, akinek nem nagyon van módja másként kommunikálni. A rendszer ráadásul az adott betegre „edzve” egyre pontosabbá válhat, így gyakorlással egyre több szót tud érthetően közvetíteni, mondják a fejlesztők.

Chang ugyanakkor hangsúlyozza, hogy a módszert egyelőre csak beszédképes résztvevőkön tesztelték, így azoknál, akik nem tudnak beszélni, hosszabb időbe telhet, amíg érthető szavakat tud generálni a rendszer. Különösen abban az esetben, ha az illető sosem tanult meg beszélni. A szakértő azt is hozzáteszi, hogy a módszer „gondolatolvasásra” nem alkalmas: csak azokat az agyi jeleket fordítja szavakká ugyanis, amelyek a hangképzésre irányulnak.

Neked ajánljuk

Kiemelt
-{{ product.discountDiff|formatPriceWithCode }}
{{ discountPercent(product) }}
Új
Teszteltük
{{ product.commentCount }}
{{ voucherAdditionalProduct.originalPrice|formatPrice }} Ft
Ajándékutalvány
0% THM
{{ product.displayName }}
nem elérhető
{{ product.originalPrice|formatPriceWithCode }}
{{ product.grossPrice|formatPriceWithCode }}
{{ product.grossPrice|formatPriceWithCode }}
{{ product.displayName }}

Tesztek

{{ i }}
{{ totalTranslation }}
Sorrend

Szólj hozzá!

A komment írásához előbb jelentkezz be!
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mondd el, mit gondolsz a cikkről.

Kapcsolódó cikkek

Magazin címlap arrow_forward