A Veo 3-mal a Google valóságos videogeneráló-lázat indított el, aki csak aktív ezen a területen, most megpróbál valamivel előrukkolni. Ezúttal éppen arról számolhatunk be, hogy már a Midjourney is egy videók létrehozására szolgáló funkcióval állt elő.
Egyre nehezebb követni az elmúlt hetekben, napokban, hogy éppen melyik mesterséges intelligenciával foglalkozó fejlesztőcsapat áll elő olyan funkcióval, ami valamilyen formában videók generálását teszi lehetővé. A Midjourney egy időben rendkívül felkapott volt annak köszönhetően, hogy remek minőségű képeket tudott elállítani, egészen egyedi stílusokkal volt képes dolgozni. Most ezt a cég a mozgóképekkel is megvalósíthatja.
Egyszerűen csak V1 Video modell néven jelentette be az első videogeneráló nyelvi modelljét a Midjourney csapata. Jelenleg ezzel az eszközzel képeket lehet mozgásba lendíteni. Nem lehet megírni szabadon, hogy mit szeretne a videóban látni az ember, arra képes a modell, hogy egy rövid videóban elevenítse meg a képet, amit feltölt a felhasználó. Azt azonban lehet alakítani, hogy a kép milyen módon legyen animált.
A vállalat elmondása alapján az alapanyag nemcsak feltöltött kép lehet, hanem egy a platformon éppen létrehozott képet is lehet animálni igény szerint. A Midjourney által alkotott képek felhasználásánál alapul vehető olyan anyag is, amit egy másik ember hozott létre a saját elképzelései, instrukciói szerint. A továbbiakban a platform keretében létrehozott képeknél már látható lesz egy új „Animate” gomb, melynek megnyomását követően elindul a rövid videó generálása. Az egyedi képek feltöltésénél és a generált kiindulási alapoknál egyaránt a „kezdő képkocka” lesz a kép.
A lehet legkönnyebb használhatóság érdekében automatikusan megoldja a képek paraméterezett animálását a Midjourney, viszont amennyiben valaki nem elégedett a végeredménnyel, vagy pontos elképzelése van arról, hogy mit szeretne látni, az a „Manual” gombot használva bevihet majd egyedi leírást, amit felhasznál a platform az animáláshoz. Az alapértelmezett prompt minden esetben annyi, hogy „just makes things move” vagyis „csak mozogjanak a dolgok”.
A videogenerálók általában néhány másodperces anyagokat szokta létrehozni, itt sincs ez másként, de a Midjourney tett egy csavart a sztoriba. Az animált képek 5 mp-esek lehetnek alapjáraton, viszont biztosít a platform hosszabbítási lehetőséget. Meg lehet majd toldani az anyagokat 4 másodperccel, egymás után négy alkalommal is. Szóval akár 16 mp hozzáadható az 5 mp-es videókhoz, ezzel pedig végeredményben 21 másodperces videók érhetők el.
Jelenleg kizárólag a Midjourney Discord szerverén keresztül lehet kipróbálni az új lehetőséget, és elő kell fizetnie a felhasználónak a szolgáltatásra. Ezt követően korlátozottan használható a videogenerálás, és nincs is pontosan megadva, hogy mennyi videót lehet létrehozni. A 10 dolláros havi díjért cserébe 3,3 óra GPU időt ad a Midjourney, ami átlagosan 200 kép létrehozására elegendő, a videók létrehozása pedig nagyjából 8-szor annyi időt vesz igénybe, mint a képek létrehozása. Viszont a videók hosszabbítása is időigényes, ami még tovább bonyolítja a képletet.
Miközben a Midjourney igyekszik előre haladni, tartani a versenyt a riválisokkal, aközben a cégnek azzal is foglalkoznia kell, hogy a Disney és a Universal is pereli. A stúdiók szerint a platform jogsértést követ el, mikor másolja a levédetett mesehősöket és más kerektereket. Ezt pedig annak köszönhetően tudja megtenni, hogy a nyelvi modell tréningezéséhez engedély nélkül használták fel a tartalmaikat.