Videogeneráló MI szolgáltatással állt elő az OpenAI

VIDEOGENERÁLÓ MI SZOLGÁLTATÁSSAL ÁLLT ELŐ AZ OPENAI

Sora névre hallgat a vállalat legfrissebb fejlesztése, és ezzel feladja a leckét a riválisoknak.

Szécsi Dániel (DemonDani)

A text-to-text modellek a legegyszerűbb generatív MI megoldások, és ma már a text-to-image modellek sem okoznak túlságosan komoly fejtörést a fejlesztők számára. Egyre több cég biztosít ilyen fejlesztést különböző formában. A text-to-video azonban egy teljesen másik szint, de az OpenAI már ezt is megoldja.

Egy ideje már vannak egyszerűbb text-to-video MI szolgáltatások, de igazán jól működő és a széles közönség számára elérhető megoldás nincs. A legtöbb ilyen generatív mesterséges intelligencia a képeken a témák mozgatását megoldja, de például a fizikát már nem tudja élethűen kezelni. Az OpenAI elmondása alapján a Sora ezzel is boldogulni fog általában, persze azért még hibázhat.

„A Sora képes realisztikus és ötletes jeleneteket létrehozni egyszerű szöveges instrukciókból” – jelentette be a vállalat.

Az újdonság legfeljebb 60 másodperces – vagy ha úgy jobban tetszik, 1 perces – videókat tud létrehozni, ami már jó eredménynek számít ezen a fronton. A legtöbb ilyen generatív MI modell még csak néhány másodpercnél jár minimális képkockaszám mellett. A Stable Video Diffusion például csak 25 egybefüggő képkockával indított, a Google kísérleti Lumiere nevű eszköze pedig 80 képkockát tud.

A Sora jelenleg a „red team” vizsgálata alatt áll, akik igyekeznek azt felderíteni, hogy milyen módszerekkel lehet visszaélni a szolgáltatással. Az OpenAI ezt felhasználva tudja korlátozni a rendszert, hogy az a lehető legbiztonságosabb formában kerüljön bevezetésre. Már egy kép vagy hanggeneráló MI-nek is hatalmas a kockázata, és hasonló a helyzet a videót előállító szolgáltatással is.

Ezzel párhuzamosan az OpenAI már elérhetővé tette az eszközt néhány művésznek, dizájnernek, filmkészítőnek, hogy visszajelzéseket kapjon ilyen frontról is. Hiszen a cégnek az lenne a célja, hogy a videósok használatba tudják venni a Sorát, animációkat készíthessenek különböző jelenetekhez, vagy akár csak inspirációt szerezzenek felvételekhez. Az elkövetkezendő időszakban a Sora folyamatosan fejlődni fog, ez egyelőre még a pályája elején jár, mint annak idején a DALL-E 2021-ben.

Apropó, az OpenAI a DALL-E 3 kapcsán is szolgált egy fontos bejelentéssel nemrégiben. Elmondta a vállalat, hogy egy új vízjelet is bevezet, hogy a mesterséges intelligencia által manipulált képeket ki lehessen szúrni. Ezt a C2PA csoport iránymutatásainak megfelelően oldotta meg, amit már az Egyesült Államok kormánya elvárásként kezel a tisztább MI használatot szem előtt tartva.

Az OpenAI és a kormány viszonya nem a legjobb, és ez ebben az esetben is megmutatkozott. A vállalat ugyanis hozzátette, hogy igazából a sokak által elvárt vízjel igazából egyáltalán nem eltávolíthatatlan. Még akár véletlenül, netes feltöltések, megosztások során is elveszhet, miközben a képeken megjelenő vizuális vízjeleket is pillanatok alatt le lehet vágni. De azért bíznak abban, hogy a jövőben tényleg kevesebb lesz a visszaélés és mindenki támogatni kezdi az újfajta metaadatok kezelését is.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

VIDEOGENERÁLÓ MI SZOLGÁLTATÁSSAL ÁLLT ELŐ AZ OPENAI

TOP 5 AZ IPON-ON