Fordítóprogramokkal a kis nyelvekért

Rengeteg olyan nyelv van a világon, amelynek az egyre szélesebb körű internet-hozzáférés ellenére alig találni nyomát online. A szakértők szerint ezeket a nyelveket különösen erősen fenyegeti a kihalás veszélye. 

Fordítóprogramokkal a kis nyelvekért

Rengeteg olyan nyelv van a világon, amelynek az egyre szélesebb körű internet-hozzáférés ellenére alig találni nyomát online. A szakértők szerint ezeket a nyelveket különösen erősen fenyegeti a kihalás veszélye, mivel nem reprezentálódnak kellőképpen az „információs szupersztrádán”. A Microsoft és Google új fordítási technológiákkal igyekszik segíteni ezeken a világhálóról eltűnő vagy kimaradó nyelveken.

Mindkét cég évek óta képviselteti magát a fordítóiparban, de mindeddig elsődlegesen arra koncentráltak, hogy az olyan világnyelvek, mint az angol, a spanyol vagy a kínai közötti kommunikációt áthidalják, illetve ezekre ültessék át a kevesebbet használt nyelven íródott szövegeket. A ténylegesen használható fordítóprogramok nem nyelvkönyveket bújva „tanulnak”, hanem emberi fordítók által megalkotott dokumentumok millióinak statisztikai összehasonlítása révén sajátítják el a szakma fogásait. Ez kevéssé reprezentált nyelvek esetében nyilvánvalóan problémákba ütközhet, így a Google némiképp módosította saját szoftverét, és első körben öt indiai nyelvre (bengáli, gudzsaráti, kannada, tamil, telugu) koncentrálva direkt nyelvtani tudnivalókat táplált programjába. A Microsoft ezzel egy időben létrehozott egy szolgáltatást, amely lehetővé teszi, hogy az egyes nyelvközösségek maguk hozzák létre saját nyelvük fordítórendszerét olyan módon, hogy maguk tölthetik fel a forrásanyagokat, melyek alapján a program elsajátítja a nyelvet.

A Google szakértői akkor észlelték először, hogy a programnak konkrét nyelvtani szabályokra is szüksége lehet, amikor a japán fordításokban felmerülő szórendi problémákat igyekeztek orvosolni. Folyamatosan középre került ugyanis az állítmány a lefordított mondatokban, holott annak a japán nyelv szabályai szerint a mondat végén van a helye. Tisztán statisztikai módszerek alapján azonban ezt a szabályszerűséget szoftver magától nem volt képes leszűrni, így szükség volt arra, hogy némi nyelvtani tudást tápláljanak a programba. Ezt követően vált lehetővé az indiai szubkontinensen milliók által beszélt, de a világhálóról szinte teljesen hiányzó nyelvek felvétele a fordítóprogramba.

A szoftvernek adott nyelvi leckék során célirányosan nagy mennyiségű olyan mondatot tápláltak a rendszerbe, amelyekben a mondatrészek címkékkel voltak ellátva, ez pedig jóval több instrukciót jelent annál, amelyet a szoftver általánosságban kap. A szakértők elmondása szerint a fordítóprogram egyelőre nem működik olyan hatékonysággal a kisebb nyelveknél, mint például a világhálón gyakran felbukkanó francia vagy német nyelv esetében, de az első lépés megtörtént: ezek a nyelvek elérhetővé váltak a hálón, és minél többen használják őket, annál jobb lesz a szoftver is. Ashish Venugopal, a Google fordítóprojektjének egyik kutatója elmondta, hogy fő céljuk az lenne, hogy az embereknek ne kelljen azon vacillálniuk, hogy anyanyelvükön vagy angolul írják a blogjukat. „Segítünk a világnak, hogy bármilyen nyelven írt blogot el tudjon olvasni.”

A Microsoft nemrégiben elinduló, Translator Hub nevű szolgáltatása révén bármely nyelv képviselői maguk fejleszthetik saját fordítóprogramjukat. Ez a kezdeményezés kifejezetten olyan nyelvközösségeknek szól, amelyek biztosítani kívánják anyanyelvük széleskörű használatát a világhálón, mondta el a Kristin Tolle, a Microsoft Research igazgatója. A rendszer úgy működik, hogy lefordított anyagokat és azok eredetijét fel lehet tölteni egy fiókon keresztül az oldalra, és ezek alapján az algoritmus lassan megtanulja az új nyelvet. A rendszer másik óriási előnye, hogy általa lehetőség kínálkozik a szaknyelvi kifejezések lefordításának egyszerűsítésére és egységesítésére is, amely problémával a hagyományos fordítóprogramok általában kevéssé boldogulnak.

A Microsoft a kaliforniai Fresnóban élő népes kínai hmong közösség vezetőivel együttműködve kezdte meg programját. A hmong nyelvet 4 millióan beszélik világszerte, de egészen eddig semmiféle elektronikus fordítóeszközzel nem rendelkezett. Különféle gépi fordítóprogramok egyébként egyelőre mindössze a világ száz nyelvére íródtak, holott a Föld lakói körülbelül 7000 különböző nyelven beszélnek.

Greg Anderson , a kihalóban lévő nyelvek megmentéséért küzdő Living Tongues alapítvány igazgatója egyetért azzal, hogy az online jelenlét létfontosságú ezen nyelvek fennmaradása szempontjából. Manapság ha egy cég vagy közösség nem található meg a világhálón, akkor sok szempontból olyan, mintha nem is létezne, mondja. A szakértő hozzáteszi azonban, hogy igazi „visszatérés” ezekkel a módszerekkel csakis olyan nyelvektől várható, amelyek beszélői ismerik és tudatosan saját nyelvükön használják a világhálót. A nyelvek megmentésének azonban más aspektusai is vannak, egy adott nyelv nem a fordíthatóságától marad fenn, hanem attól, hogy nyelvközössége, kulturális értékvilága és hagyományai megőrződnek, ennek pedig maximum egy töredéke oldható meg online eszközökkel. És akadnak persze olyan közösségek is, amelyek technikai okok miatt nem képesek a most felkínált eszközök használatára, így esetükben egyetlen megoldásként a terepmunka kínálkozik.

 

Tesztek

{{ i }}
arrow_backward arrow_forward
{{ content.commentCount }}

{{ content.title }}

{{ content.lead }}
{{ content.rate }} %
{{ content.title }}
{{ totalTranslation }}
{{ orderNumber }}
{{ showMoreLabelTranslation }}
A komment írásához előbb jelentkezz be!
Még nem érkeztek hozzászólások ehhez a cikkhez!
Segíts másoknak, mond el mit gondolsz a cikkről.
{{ showMoreCountLabel }}

Kapcsolódó cikkek

Magazin címlap arrow_forward