Kosár

A kosár jelenleg üres

Bejelentkezés &
Regisztráció

Jelenleg nincs belépve.

Válassza ki az oldal nyelvét

TERMÉKEINK

iPon FÓRUM

iPon Hírek

Gépi tanulás révén javul a Google Assistant hangja

  • Dátum | 2017.10.11 10:01
  • Szerző | DemonDani
  • Csoport | MOBILTELEFON
A Google 2014-ben vásárolta fel a DeepMindot, és annak idején még senki nem látta világosan, hogy milyen céllal tette ezt a keresőóriás, azonban a lépés mostanra értelmet nyert. A DeepMind fejlesztésének köszönhetően beszél minden eddiginél emberibben a Google Assistant digitális személyi asszisztens.


A DeepMind 7 éve jött létre, és már három éve annak, hogy csatlakozott a Google zászlaja alá (vagyis pontosabban azóta már az Alphabet alá tartozik, ami a Google anyacége). Az eredetileg brit székhelyű startup a mesterséges intelligencia terén elért eredményeivel és fejlesztéseivel kelthette fel a keresőóriás figyelmét. Az Alphabet alatt a DeepMind különállóan működik, de persze minden fejlesztése azt a célt szolgálja, hogy a Google termékeinek fejlődéséhez hozzájáruljon. És mint azt most már mindenki tudja, sikerrel is teszi ezt, ugyanis a WaveNet névre hallgató technológia révén a Google Assistant szolgáltatás az eddiginél szignifikánsan természetesebb beszédhangon szólal meg, amikor a felhasználókkal kommunikál az okostelefonokon, a különböző lakás asszisztenseseken (pl. Google Home termékcsalád) vagy egyéb eszközökön keresztül.


A WaveNetről a DeepMind először egy évvel ezelőtt beszélt. Ez a technológia azt a célt szolgálja, hogy a rendszer a gépi tanulás és a mesterséges intelligencia felhasználásával arra törekszik, hogy a különböző elektronikai készülékből érkező digitális hang épp olyan folyékony és természetes legyen, mintha egy ember szája formálná a szavakat. Nagyjából egy éve még az eljárás nagyon kezdetleges volt, a valós idejű használatra teljesen alkalmatlannak tűnt. A WaveNetnek 0,02 másodpercnyi beszédhang „kiejtésének” a megformálása egy egész másodpercet vett igénybe, miközben óriási számítási kapacitást emésztett fel a rendszer. Például egy egyszerű GPS-es parancsra két percet kellett várni.

A fejlesztők töredelmes munkájának eredményeként mostanra a folyamat az ezerszeresére gyorsult, és ilyen formán már kompromisszumok nélkül használható az eljárás. Egy másodpercnyi hanganyagot most már 50 milliszekundum alatt tud létrehozni a DeepMind terméke, ami lenyűgöző fejlődés 12 hónap alatt. A megfelelő hangminőség érdekében egy másodperc alatt 24 ezer mintavételezéssel dolgozik a WaveNet és a korábbi 8 helyett 16 bites hangot állít elő. Az alábbiakban több példát is meg lehet hallgatni, hogyan szólal meg az eddigi megoldásokhoz képest a WaveNet.


A DeepMind fejlesztése még csak két nyelvet beszél a Google Assistant által támogatottak közül. Az egyik, aminek a természetes kiejtését mostanra elsajátította, az nem meglepő módon az angol, a kezdetektől fogva ezt használva fejlesztették, és eleve ezt használják a legtöbben, így érthető a támogatás. A másik viszont a japán, ami már némiképp meglepő. A japán kiejtés nem az egyszerűségéről ismert, de ahogy azt a fenti demonstrációban is lehet hallani, a WaveNetnek ebbe sem törik bele a bicskája, nagyon szépen alakítja a szavakat. Persze a Google és a DeepMind egyáltalán nem akar itt megállni, és már tervben van a nyelvtámogatás kiterjesztése. További újítás, hogy az Egyesült Államokban már kétféle hangból lehet választani az Assistantnál, az egyik női, a másik pedig férfi. Így mindenki a számára szimpatikusabbat alkalmazhatja.

Hozzászólások

Nem vagy bejelentkezve, a hozzászóláshoz regisztrálj vagy lépj be!

Eddigi hozzászólások:

  • 3.
    2017. 10. 11. 13:43
    Összejöttem egy csajjal, poénból beírtam a Google AI-nek, h lett csajom. Kíváncsi voltam mit reagál rá. Az meg reagált egyből és mondta milyen csodálatos és gratulált Szerintem tud valamit ez a Google. Én látok benne lehetőséget. Szerintem -jelenleg- a legfejlettebb AI, ami mögött a legjobb tartalomszolgáltatás található meg, akár Maps, akár Youtube, akár a keresőmotort nézzük.
  • 2.
    2017. 10. 11. 10:42
    És még sem nigger, sem jihadista nincs köztük, ez így tényleg botrányos lesz.
  • 1.
    2017. 10. 11. 10:22
    Csak női meg férfi hang van??? Ú lesz itt gender háború