Shop menü

TÖBB TUCAT NYELVET ISMERŐ BESZÉDFORDÍTÓ MODELLEL ÁLLT ELŐ A META

Olyan ez kicsit, mint Douglas Adams regényében a Bábel-hal, csak nem kell az embereknek a fülökbe dugniuk egy különös lényt.
Szécsi Dániel (DemonDani)
Szécsi Dániel (DemonDani)
Több tucat nyelvet ismerő beszédfordító modellel állt elő a Meta

A Meta a Google és a Microsoft (OpenAI) mellett rengeteg energiát fektet a mesterséges intelligencia fejlesztésébe, hosszú évek óta dolgoznak a szakemberek nagy nyelvi modelleken különböző felhasználási lehetőségekkel. Többnyire nyíltan elérhetővé tette a megoldásait, nincs ez másképpen most sem.

Nyíltan elérhető formában publikálta a SeamlessM4T névre hallgató nagy nyelvi modellt a cég, ez egy beszédfordításra specializálódott MI, ami már most is nagyon sokrétű, de idővel még magasabb szintre érhet majd.

A név valójában nagyon hosszú lenne, ugyanis az Seamless után szereplő „M4T” egy rövidítés, a Massively Multilingual and Multimodal Machine Translation kifejezést takarja, szóval egy masszívan többnyelvű és multimodális működésre képes gépi fordítóról beszélhetünk, ami kiemelkedő gördülékenységgel teszi majd a dolgát. Tényleg sokoldalú megoldásról van szó, cseppet sem túlzó a megnevezése.

Pontosan nem közölte a Meta, hogy mennyi nyelvet támogat, és hogy melyek ezek a nyelvek, de azt elmondta, hogy közel 100 nyelven képes különböző szövegeket fordítani. Minden bizonnyal a magyar is szerepel az ismert és támogatott nyelvek között. Viszont hozzá kell tenni azt is, hogy a legtöbb nyelvnél még csak a szöveges fordításokat képes megoldani. A „speech-to-speech” hangalapú fordítás esetén 35 nyelvre képes átalakítani a közel 100 bementi nyelvről a tartalmakat.

„Egy olyan univerzális nyelvi fordító megalkotása, mint a Galaxis útikalauz stopposoknak című könyvben szereplő fiktív Bábel-hal, nagy kihívást jelent, mivel a meglévő beszédből beszédre és szövegből szövegre fordító rendszerek a világ nyelveinek csak egy kis töredékét fedik le” – mondta Meta. Kiemelte a cég, hogy a SeamlessM4T egymagában teljesíti a fordítási feladatokat, nem úgy, mint sok fordítószoftver, melyek mögött sokszor többféle rendszer dolgozik párhuzamosan.

Galéria megnyitása

Büszkén beszélt arról is a Meta, hogy a SeamlessM4T felismeri a beszélgetés során a kódváltást, és azt is, ha egy mondatban valaki többféle nyelvet használ. Szóval azt is le tudja majd fordítani németre, amit valaki úgy mond magyarul, hogy angol szavakat is használ közben. Ez manapság már egyáltalán nem szokatlan, és ezt a Meta fejlesztői is felismerték. Az új fordító modell alapjaiban korábbi megoldások is megtalálhatóak, például része ennek a No Language Left Behind korábbi fordító szolgáltatás is, ami nagyjából 200 nyelvet kezelt viszonylag jól szövegfordításoknál.

A fordítással nagyon rosszul lehet keresni önmagában, egy nehezen monetizálható dologról van szó, mégis minden nagy technológiai vállalatnak van fejlett fordítója, és nagy hangsúlyt fektet a nyelvi akadályok legyőzésére. Lényegében azért csinálják ezt, hogy a szolgáltatásaikkal, tartalmaikkal minél szélesebb közönséget tudjanak elérni, kiszolgálni. Ez hajtja a cégeket abban, hogy kiváló fordító szolgálatatásokat alkossanak a felhasználóknak. A Meta állítólag szabadon elérhető anyagokkal tréningezte a SeamlessM4T-t.

A cég Meta a metaverzumban is szeretné majd ezt bevetni, ahol az emberek ezáltal képesek lennének mindenféle nyelven kapcsolatot teremteni egymással. A Google is dolgozik egy rendkívül komplex beszédfordító nyelvi modellen, bizonyos frontokon, például a YouTube-on már teszteli is Universal Speech Modelt. Ez már egy májusi beszámoló szerint több mint 100 nyelvet támogatott. Plusz a Google-nél ettől függetlenül még legalább két eltérő alapon üzemelő fordító létezik.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére