A Google számára a Fordító fejlesztése mindig is egy fontos feladat volt. A cég szeretné azt elérni, hogy akár egészen egzotikus nyelveket is képes legyen kiszolgálni a jövőben. Most egy jelentős lépést tett ebbe az irányba, ugyanis a Google Fordító nyelvtámogatását sikerült közel a duplájára növelnie.
Több mint 1 milliárd ember használja globálisan a Fordítót, és talán kevesen tudják, de ez a szolgáltatás már több mint 18 éve indult. A keresőóriásnak eddig 133 nyelv támogatását sikerült beemelnie. Legutóbb 2022 májusában számolhattunk be arról, hogy bővül a Fordító nyelvtámogatás, akkor 24 új nyelvet „tanult” meg a szolgáltatás. Most ennél egy sokkal nagyobb volumenű bővítésre került sor, de a terítékre került nyelvek már szűkebb közösségeket érintenek.
Ezúttal arról beszélhetünk, hogy 110 nyelv került bevezetésre, így már összesen 243 nyelvet fog támogatni a platform.
Sok éve dolgozik már azon a Google, hogy a mesterséges intelligenciát és a nagy nyelvi modelleket hasznosítsa a fordítási technológiák színvonalának emelésére. Már a jelenlegi MI láz előbb évekkel elindult ebbe az irányba a cég. A jelenlegi áttörést a nyelvtámogatásban a PaLM 2 nyelvi modell bevetésével sikerült összehoznia a szakembereknek. Tavaly májusban rántotta le a leplet a Google a PaLM 2-ről, és már akkor arról beszéltek, hogy több mint 100 nyelven tanították fel, és ez azóta csak még tovább bővült.
A PaLM 2 rengeteg Google szolgáltatás mögött van használatban, és elsősorban azt lehetett látni, hogy a nyelvi képességeit emelte ki a vállalat. A korábbi beszámolók alapján ez egy rendkívül jól skálázható LLM rendszer, ami brutális mennyiségű paraméterrel képes dolgozni, és ennek köszönhetően lehet nagyon hatékonyan alkalmazni nyelvtanulás során. Korábbi információk szerint a PaLM 2 340 milliárd paraméterrel dolgozott és 3,6 billió tokent használtak a kezdeti feltanítása során.
A Google Fordítón dolgozó csapat munkáját főleg olyan esetekben tudta a PaLM2 nagyon megkönnyíteni, mikor hasonló nyelveket kellett megtanulnia. A hindivel rokonságban álló awadhi és marwadi támogatásában az MI nagyon hasznosnak bizonyult. A francia kreolhoz pedig a mauritiusi kreol és a seychelle-i kreol áll olyan közel, hogy a PaLM 2-vel jelentősen meg lehetett könnyíteni a támogatás kiterjesztését.
Mostantól támogatott a kantoni nyelv is, amit a Google elmondása alapján már hosszú ideje kértek a felhasználók, sokan vártak erre. Azt is megtudhattuk, hogy az új nyelveknek nagyjából a negyede az afrikai kontinenst érinti. Afrikában egyrészt sok kisebb nyelv van jelen, másrészt ott most még dinamikusan növekedik a felhasználói tábor a lehetőségekhez mérten. Van olyan nyelv is, amit a Google szerint több mint 100 millió ember ismer, de a java inkább az 1 és 100 millió közötti bázist érinti.
Tavaly márciusban beszélt arról a Google, hogy az a célja, hogy egy létrehozzon egy olyan fordítót, ami akár 1000 nyelvet támogat majd globálisan. Ebben már egészen szűk közösségek nyelvei is benne lennének már, ilyen szinten ez magától értetődő. A fordító eszközt a cég az Universal Speech Model, röviden USM néven vezette fel, de erről idén még nem lehetett új információt hallani. Vélhetően ezen úgy dolgoznak, hogy a Google Fordító csapatával lehetnek átfedések.