Shop menü

AZ OPENAI YOUTUBE-RÓL LEKAPART ADATOKAT IS HASZNÁLHATOTT, ÉS A GOOGLE IS ERRE TÖREKEDIK

A YouTube egy kiváló adatforrás lehet a nagy nyelvi modellek számára, ha betanításról van szó, többféle formában felhasználhatja a tartalmakat akár a Google is.
Szécsi Dániel
Szécsi Dániel
Az OpenAI YouTube-ról lekapart adatokat is használhatott, és a Google is erre törekedik

A The Information hasábjain jelent meg egy friss elemzés arról, hogy a YouTube egy páratlan lehetőséget biztosító „eszköz” lehet a Google számára a mesterséges intelligencia fejlesztésében. Ennek kapcsán pedig elhintette a lap, hogy ezt igazából mostanra valószínűleg a konkurencia is felismerte, bár erről hivatalosan semmit nem lehet tudni.

A nagy MI robbanásnak még egészen biztos, hogy csak a küszöbén állunk, de már annyira intenzíven harcolnak vállalatok ezen a területen, amire nagyon hosszú ideje nem volt példa. A Google és az OpenAI áll a legjobban ezen a téren abból, amit most publikusan látunk, de persze azt nem tudhatjuk, hogy a színfalak mögött milyen fejlesztések folynak még. A Microsoft az OpenAI partnereként jelenleg nagyon intenzíven fejleszt, és igyekszik a Google-lel szemben minél nagyobb előnyt kiépíteni.

A nagy nyelvi modellek fejlődésével az adatok még jobb felértékelődtek, a The Information pedig ezért járt annak utána, hogy a YouTube értékeit miként használhatják majd ki a vállalatok. A YouTube a Google tulajdonában van, éppen ezért a Google fér hozzá ezek kapcsán a legtöbb információhoz, de a szakemberek lényegében biztosra veszik, hogy igazából a konkurencia figyelmét sem kerülhette el a világ messze legnagyobb videós platformja.

Galéria megnyitása

Az elemzések alapján jó esély van arra, hogy igazából az OpenAI sem volt rest a YouTube-ot használni a tréningezés során. Olyan adatcsomagokon edződhettek a különböző szolgáltatásai, amik publikusan elérhetőek a YouTube-on. Az OpenAI hivatalosan sosem árulta el, hogy milyen forrásokból származó adatokat használt fel a GPT nagy nyelvi modellnél, valamint az ehhez kapcsolódó fejlesztéseknél, így például a DALL-E, a ChatGPT vagy éppen a Whisper esetében.

Úgy vélik a The Information elemzői, hogy az OpenAI elsődlegesen a Whisper esetében használhatta fel a YouTube-ot a betanítás során. Ez a vállalat automatikus beszédfelismerő szolgáltatása, ami még a ChatGPT előtt született meg. „680 ezer órányi többnyelvű, többféle tartalomhoz kapcsolódó, felülvizsgált adatot gyűjtöttünk a webről, és ezen tréningeztük a rendszert” – olvasható az OpenAI oldalán, de részleteket a cég senkinek nem árul el, még a hatóságoknak sem, ha azok nem tudnak alapos indokkal szolgálni.

Galéria megnyitása

Az OpenAI mindig arra hivatkozik, hogy a források felfedése sértené az üzleti érdekeit, így nem kötelezhető arra, hogy elmondja, honnan szerezte be az adatokat. Ilyen információ felfedésével elveszíthetné az előnyét a versenytársakkal szemben. Ugyanakkor az általános vélekedés az, hogy főleg azért nem akarja az OpenAI felfedni a lapjait, mert nagy valószínűséggel ez különböző perekhez vezetne. A Getty Images például mostanra beperelte a Stability AI-t, miután meglehetősen komoly bizonyítékokkal tudtak szolgálni arra vonatkozóan, hogy a fejlesztők a Getty vízjelezett képeit is „kölcsönvették”.

A The Information szerint a Google magabiztosan használhatja majd fel a YouTube-ot, és a legújabb gépi tanulási rendszerekkel, valamint nagy nyelvi modellekkel akár azt is meg tudja majd oldani, hogy a videók kép- és hanganyagát is felhasználhatja, sőt mi több, igazából szöveges átiratok révén még a chatbotja fejlesztéséhez is alkalmazhatja. A YouTube mögött a vállalat csendben már elkezdte alkalmazni az USM (Universal Speech Model) rendszert, ezzel készíti a videóknál a feliratot, ha nincs kézzel bevitt anyag, és a feliratok fordításaiért is ez felel.

Az USM révén tehát a Google már pillanatok alatt képes elérni a videók szöveges anyagát, ami felfoghatatlanul nagy mennyiségű adatot jelent. Természetesen a Google sem jelenti ki teljesen nyíltan, hogy a YouTube adatai használta tréningezésre, de viszonylag egyértelmű, hogy erről van szó. Azt elárulja a kutatói oldalán a vállalat, hogy jelenleg több mint 300 nyelven tanítják, és 12 millió órányi szöveget, 28 milliárd komplett mondatot használtak fel ehhez.

Sőt mi több, a Google már dolgozik egy teljesen új modellen is, ami valóban egy mérföldkőnek fog számítani a vállalat szerint, és a The Information arról ír, hogy egy a fejlesztéshez közel álló forrás elhintette, hogy a Gemini már eleve arra lesz felkészítve, hogy a YouTube-ot hatékonyan tudja felhasználni a tanuláshoz. A Geminiről a Google annyit árult el egyelőre, hogy eleve úgy kezdték fejleszteni, hogy kombinált működésre legyen képes, kezeljen például képet, hangot és szöveget is egyebek mellett. Jól alkalmazható lesz más eszközökbe integrálva, API elérésekkel.

„Bár még nagyon korai szakaszban van a Gemini, de már most olyan impresszív kombinált képességekről tesz tanúbizonyságot, amire jelenleg nincs példa.” – jelentette ki a vállalat.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére