Májusban az OpenAI több nagy bejelentést is tett a Google fejlesztői konferenciája előtt néhány nappal. A vállalat akkor rántotta le a leplet a GPT-4o (omni) nagy nyelvi modellről, és akkor mutatta be az új hangalapú kommunikációs módot is. Ennek a bevezetését a cég az eredeti tervekhez képest jobban eltolta, de most már ez is elindult.
Júniusban beszélt legutóbb a hangasszisztens üzemmódról az OpenAI, akkor azt tudhattuk meg ennek kapcsán, hogy biztonsági aggályok miatt csúszik valamelyest a bevezetés. Nem tudták azt megmondani, hogy mikorra lesz bevetésre kész a rendszer, csak arra tértek ki, hogy magas biztonsági és megbízhatósági elvárásokat támasztottak a rendszerrel szemben, hogy minden rendben legyen vele. A jelek szerint most jött el a nagy pillanat, de az OpenAI továbbra is óvatos ezzel kapcsolatosan.
A ChatGPT Hang mód egy szűk felhasználói körnek vált elérhetővé, és csak a ChatGPT Plus előfizetők próbálhatják ki.
Miután széles körben elérhető lesz az újítás, azzal a megkötéssel akkor is számolni kell majd, hogy a ChatGPT Plus elengedhetetlen a használatához. Az érdeklődőket az alkalmazásban jelenleg még az az üzenet fogadja, hogy „elkezdtük a speciális hang mód bevezetését, és lassan bevonjuk a felhasználókat az alfa változatba, hogy biztosítsuk az élmény minőségét”. A jelenlegi tervek szerint minden ChatGPT Plus előfizetőt ősz végére érhet majd el a május óta várt újítás.
A hangasszisztensként használatos ChatGPT ideális körülmények között teljesen természetes társalgási partnert jelenthet. Olyan alacsony késleltetéssel lesz képes válaszolni a felhasználók kérdéseire, kéréseire, mintha egy valódi emberrel társalogna a felhasználó. Nem lesznek már zavarba ejtő, néhány másodperces várakozások a dialógusban. Nem fog affektálni, hanem szépen hangsúlyozza a mondandóját, és érzelmeket is ugyanúgy visz majd a szövegbe, mint az emberek.
A teljesen természetes nyelvi kommunikációt ígérő fejlesztés nyelvtámogatásáról még nincs részletes információ. Azért bízunk abban, hogy tud majd magyarul is, miután már a mostani, fapadosabb Hang mód is képes az anyanyelvünkön megszólalni.
Az OpenAI egy kisebb botrányba keveredett a hangos üzemmód bemutatását követően, ugyanis a vállalatot azzal vádolták meg, hogy ellopta Scarlett Johansson hangját. A színésznő és mások is azt állították, hogy a cég engedély nélkül használta fel a hangmintáját, az OpenAI azonban úgy nyilatkozott, hogy az a hasonlóság ellenére nem Scarlett Johansson hangját használják, hanem egy másik színésznővel kötöttek megállapodást. Azt azonban a mai napig nem fedték fel hivatalosan, hogy ki áll valójában a hang mögött.
A dolog előzménye, hogy az OpenAI vezetője, Sam Altman nem titkoltan rajong a Her című filmért, és tavaly felkeresték Scarlett Johanssont, hogy adja a hangját az OpenAI fejlesztéséhez. A színésznő azonban erre a megkeresésre nemet mondott. Ezért érte nagy megdöbbenés, mikor szinte mindenki arra asszociált a ChatGPT hangos módjánál Johanssont hallja. De a jelek szerint az OpenAI egyszerűen csak keresett egy olyan színészt, akinek nagyon hasonló a hangja, és vele állapodott meg, miután Johansson elutasította a vállalatot.
Több problémát már nem szeretnének, a Sky fantázianevű hangopció továbbra is elérhető marad. De az elmúlt hetekben, hónapokban sokat dolgoztak a mérnökök például azon, hogy jobb hatékonysággal ismerje fel a rendszer, mikor kell a válaszadást elutasítani, és mikor nincs hátsó szándék a kérdésben. Állítólag több mint 100 fős csapat teszteli a modell sebezhetőségét minden elképzelhető szempontból. Az elmúlt időszak tapasztalatai alapján pedig már számos új szűrési technikát is alkalmazni kezdtek.
Kíváncsiak leszünk az első felhasználói beszámolókra a Hang móddal való találkozást követően. Az első bemutató után a várakozások mindenképpen megnőttek, de bízunk abban, hogy a rendszer tényleg annyira jól fog teljesíteni, mint ahogyan azt az OpenAI belengette.