Kosár

A kosár jelenleg üres

Bejelentkezés &
Regisztráció

Jelenleg nincs belépve.

Válassza ki az oldal nyelvét

TERMÉKEINK

iPon FÓRUM

iPon Cikkek

Az univerzális fordító és a mai tolmácsprogramok

  • Dátum | 2013.01.06 08:01
  • Szerző | Jools
  • Csoport | EGYÉB

A gépi tolmácsolás ötlete, mint sok más dolog, először a tudományos-fantasztikus művekben bukkant fel. A Star Trek univerzális fordítója például a közlő agyhullámaiból olvassa ki a jelentést, amit aztán a kívánt nyelven közöl is használójával. Számos olyan fejlesztéssel találkozhattunk az elmúlt évtizedekben, amelynek alapjait valaha egy sci-fi író ötlötte ki, és egyre-másra hallunk is különféle tolmácsprogramokról, amelyek a bábeli zűrzavar felszámolásával kecsegtetnek. Érdekes kérdés tehát, hogy vajon mennyit kell még várni az iskolai nyelvtanulást fölöslegessé tevő, automatizált, szimultán fordítógépek megszületéséig? Feltéve persze, hogy lehetséges egyáltalán ilyet alkotni.

Az elmúlt hónapokban több olyan bejelentés is történt, amely alapján úgy tűnik, hogy ez a cél egyszerre van közel is, meg nem is. Abban biztosak lehetünk, hogy a tökéletes tolmácsgép létrehozására még egy jó darabig várni kell, de az is igen valószínű, hogy pár éven belül a mainál jóval könnyebben boldogulunk majd számunkra ismeretlen nyelvekkel találkozva. Egy londoni feltaláló, Will Powell nyáron mutatta be saját rendszerét, amely angol és spanyol beszélgető felek közt fordít oda-vissza, amennyiben a résztvevők türelmesek és lassan, artikuláltan, lehetőleg felváltva beszélnek. Powell készüléke nem beszéddé, hanem felirattá fordít, amely a felek által viselt, mobilra csatlakoztatott speciális szemüvegen vetítődik ki, tehát olyan, mintha egy feliratos filmet néznének a felhasználók.

Novemberben Japán legnagyobb mobilszolgáltatója, az NTT DoCoMo mutatta be tolmácsszolgáltatását, amely telefonhívásokat fordít japánról angolra, kínaira vagy koreaira és vissza. A felváltva beszélő felek mondandóját a cég számítógépei pár másodperces csúszással képesek átültetni a kívánt nyelvre, és a lefordított verzió a beszélő nemétől függően férfi vagy női hangon kerül lejátszásra.

A Microsoftnál is dolgoznak egy tolmácsprogramon, amelynek eddigi eredményességét úgy demonstrálták, hogy egy októberi, Tiencsinben tartott konferencián Rick Rashid vezető kutató angol felszólalását gyakorlatilag szimultán fordította mandarin nyelvre a rendszer. A Microsoft verziója a korábban említett két változat kombinációjának tekinthető, mivel feliratozásra és tolmácsolásra egyaránt képes. Ez utóbbi szoftver igazi érdekessége azonban az, hogy nagyjából egy órányi „tréning” alatt képes elsajátítani a beszélő hangjának jellegzetes vonásait, így azok az idegen nyelven fennhangzó fordításban is azonosíthatók, vagyis olyan, mintha valóban a felhasználó szólalna meg.



Bár az eddigiekben említett három rendszer megvalósítási módjában jelentősen különbözik egymástól, alapvetően nagyon is hasonló problémákkal küzdenek. Az első feladat egy tolmácsprogram megalkotásánál a beszéd felismerése és digitalizálása. Az első beszédfelismerő szoftverek a szavak építőelemeire, vagyis a fonémákra koncentráltak, majd statisztikai beszédmodellek és valószínűségi módszerek alkalmazása után ezekből igyekeztek újraépíteni a szavakat. A magyarban 38 fonéma van (14 magánhangzó és 24 mássalhangzó), az angolban pedig 40, ami nyelvek között átlag fölöttinek számít. (A piraha nyelvben például csak 11, az Afrika déli részén beszélt !xu nyelvben viszont 141 fonémát találunk.) A módszer viszonylag jól működik korlátozott szókincs esetében, azonban szabadabb beszéd mellett már kevésbé eredményes, és jelenlegi verzióiban átlagosan négy szóból egyet biztosan rosszul értelmez.

A Microsoft tolmácsprogramja számos dologban sokkal jobb elődeinél. Az első előrelépés, hogy nem a fonémák jelentik a felismerés alapegységeit, hanem három fonémás egységekkel, fonémasorozatokkal dolgozik. Ezekből nyilvánvalóan sokkal több van, mint fonémákból, az angolban például 9000 fölött van a számuk, viszont könnyebben megbirkóznak velük a felismerést végző szoftverek, így lecsökken a hibák száma is.

A Microsoft fonémasorozatokat felismerő rendszerének működése mesterséges neurális hálózati formában történik. Az agy sejtjeit modellező kis feldolgozóegységek (virtuális neuronok) kilenc rétegbe rendeződnek. A legalsó réteg neuronjai birkóznak meg a feldolgozandó beszéd alapvető hangtani jellegzetességeivel, a következő réteg egységei pedig már ezek különféle kombinációival operálnak, és így tovább, rétegről rétegre egyre kifinomultabb a felismerés szintje. Végül a legfelső réteg neuronjai közvetítik a végeredményt, vagyis megállapítják, hogy melyik fonémasor hangzott el. A helyes megoldások aztán visszatáplálódnak a rendszerbe, amely így egyre hatékonyabban fog működni.

A Microsoft kutatóinak elmondása szerint ezzel a fajta rendszerrel legalább egyharmadával csökkenthető hibák száma a fonémák felismerésén alapuló szoftverekhez képest, és egyes esetekben már azt is sikerült elérni, hogy nyolc szóból mindössze egyben tévedett a program. A Google is ehhez hasonló, mély neurális hálókat alkalmaz legújabb, androidos okostelefonokra írt beszédfelismerő szoftvereiben (bár ezeket nem tolmácsolásra használják), és a cég szakértői szerint ennek a metódusnak köszönhetően több mint húsz százalékkal sikerült csökkenteniük a hibák számát. Mivel ezen hálózatok használata igencsak megterheli a rendszert, a legtöbb beszédfelismerő, illetve fordító szolgáltatás felhő alapú. 

Hozzászólások

Nem vagy bejelentkezve, a hozzászóláshoz regisztrálj vagy lépj be!

Eddigi hozzászólások:

  • 8.
    2013. 01. 10. 22:11
    Asagrim: Az IBM nemrég épített egy szuperszámítógépet, ami legyőzte az ember valami kvízjátékban, mindezt a 20. század hajnalán!!! 50-70 év múlva már tuti lesz öngondolkodó gép, ez kétségtelen. Szóval én nem vennék rá mérget, hogy 70 év múlva lesz e még tolmácsra szükség. Gondoljunk csak bele... mi van ha találkozunk egy földön kívüli fajjal ? Egy gép fogja tudni dekódolni a leggyorsabban az adott faj nyelvi kódolását, és azt újra kódolni is tudni fogja, persze a leggyorsabban, míg lehet, nekünk embereknek év tizedekig tartana.

    A fordítást nem lehet algoritmizálni Már miért ne ? A nyelv nem más mint egy kiterjedt kód sorozat. A delfinek is tudnak kommunikálni, és ők nem használnak szavakat, csak egyszerű hangokat. Szóval egy komplex kód a nyelv, amit ha akarunk, akkor tudunk modellezni majd.
  • 7.
    2013. 01. 08. 11:50
    Vannak a számítástechnikában olyan ágak ahol pont ezzel foglalkoznak és ez egy létező dolog. A google sem véletlen menti le az egész internetet.

    Amúgy annyira ne legyél biztos benne, hogy ebből mész nyugdíjba (hacsak nem mész már 10 éven belül). A fordító programok a nagy nyelvek között már nagyon jó hatékonysággal tudnak fordítani. Nézz meg egy német-angol fordítás, meglepően jó minőségű.

    A nyugdíj meg már csak azért is erős túlzás, mert nézd meg a 40 évvel ezelőtti technikát és képzeld el mi lesz 40 év múlva.
  • 6.
    2013. 01. 08. 11:16
    " fordítás = szövegértelmezés, értelmezni meg csak intelligenciával rendelkező entitás tud"

    Számítógép is tud intelligens lenni ha úgy írják meg. Csak nincs még elég erős gépünk hozzá. Meg mi nem vagyunk még elég okosak hozzá. De a szövegértelmezés nem egy annyira nagyon felsőbbrendű dolog amit csak mi tudunk csinálni..
  • 5.
    2013. 01. 08. 06:24
    Én is annak készülök (jelenleg), de kétségem sincs affelől, hogy ebben a szakmában dolgozva fogok nyugdíjba vonulni.

    A fordítást nem lehet algoritmizálni, mivel a fordítás = szövegértelmezés, értelmezni meg csak intelligenciával rendelkező entitás tud ... a számítógép pedig biztos nem lesz ide sorolható mostanában.
  • 4.
    2013. 01. 07. 22:32
    左様なら
    Komolyra fordítva a szót, én egy picit félek azért, hiszen tolmácsnak/fordítónak készülök. Lehet, hogy pár évtized múlva már nem lesz munkám.
    Az egyetlen mentség persze a cikkben említett nyelvek "megfoghatatlansága" amit nem biztos, hogy át lehet ültetni egy másik nyelvre.
  • 3.
    2013. 01. 06. 23:23
    Szerintem a jó megoldás ezen technikák kibővített változatainak összekapcsolása lesz, kvantumszámítógépeken futtatva majd valamikor az évszázad vége felé vagy a 22. században.
  • 2.
    2013. 01. 06. 13:34
    A nyelvtanulás fontos.
  • 1.
    2013. 01. 06. 13:00
    magyarul, érdemes nyelvet tanulni