A Veo 3 valósággal berobbant a köztudatba azzal, hogy egészen elképesztő minőségű videókat tudott létrehozni a felhasználók egyszerű szöveges utasításai alapján. Most pedig a Google a Gemini keretében egy újabb érdekes lehetőséggel állt el a felhasználók számára.
A továbbiakban már nemcsak szöveges utasításokat lehet adni a videogeneráláshoz, hanem képek is alapjául szolgálhatnak a videóknak. Az új fotót videóvá alakító lehetőség révén a felhasználók még többet hozhatnak majd ki a Veo 3-ból, ez pedig minden bizonnyal tovább fűtheti az őrületet.
Fotókat már hosszú ideje lehet generatív mesterséges intelligenciával alkotni, lényegében hamarabb voltak erre széles körben elérhető eszközök, mint MI-alapú chatbotok. Az viszont még egyáltalán nem általános, hogy egyszerűen és gyorsan lehessen kiemelkedő minőségű videókat létrehozni a „semmiből”. A Veo 3 videós modellel a Google nagyon komoly változásokat indított el. Szó szerint ezrével árasztották el a közösségi médiát és a YouTube-ot azok a mozgóképek, amiket az új eszköz készített.
Nem túlzás azt kijelenteni, hogy a Veo 3 felkapottsága az egész iparágat megmozgatta. Az utóbbi hetekben a legtöbb MI-vel foglalkozó nagyvállalat igyekezett valamilyen formában videógeneráló opciót nyújtani az emberek számára. Eközben pedig a Google csapata sem pihent, a továbbiakban a fotóból videogenerálási lehetőséggel még szélesebb tömegeket mozgathat majd meg a Gemini.
A referenciaként feltöltött képekkel sokkal jobban lehet ezentúl irányítani, hogy milyen videót hozzon létre a Veo 3 a mostanra megszokott egészen jó minőségben. Továbbra is fontos szerepe lesz a videók alkotása során a szöveges utasításoknak is. Megmondhatja a felhasználó a generatív MI számára, hogy a számára feltöltött képet miként elevenítse meg. Ennek köszönhetően egyetlen képből több különböző videót is ki lehet hozni. Az emberek innentől még inkább kiélhetik a kreativitásukat.
A képek minden esetben a videók kiindulási pontját, első képkockáját jelentik majd. Továbbra is csak 8 másodperces lehet egy anyag, viszont már akár az is megoldható lesz, hogy egy 8 mp-es videó utolsó képkockájából hozzon létre az ember egy újabb videót, így összefűzve akár hosszabb egybefüggő jelenetek legyártására is lehetőség nyílhat. Megoldható lesz a jövőben az is, hogy az emberek az elhunyt szeretteikről készített fényképeket osszák meg a Geminivel, hogy azokból hozzon létre rövid videókat a mesterséges intelligencia.
A felvételekhez a modell képes hangot is létrehozni, beszédhangot, háttérzenét vagy akár alapzajt is hozzáfűzhet a videókhoz a Veo 3. A mesterséges intelligenciával létrehozott hangok is egyre élethűbbek, valóságosabbak. Ezáltal tudnak a „felvételek” egészen immerzív élményt elérni. A videók 720p-s felbontásban készülnek jelenleg, és van rajtuk látható és láthatatlan vízjel is, hogy a csalásokat féken tarthassák.
Nagyon úgy fest, hogy a Veo 3 lett a Google aranytojást tojó tyúkja a generatív MI területen. Eddig a cég minden fontosabb modelljét hamar elérhetővé tette ingyenesen széles körben, ha nem is a Gemini keretében, de legalább az AI Studióban. Arra azonban nem érdemes számítani, hogy a Veo 3 egyhamar ilyen formán kipróbálhatóvá válna. Jelenleg csak a Google AI Ultra és Pro előfizetők használhatják a szolgáltatást.
Ebből most a keresőóriás valószínűleg megpróbálja a lehető legtöbbet kihozni. Nagyon sok új előfizetőre tehetett szert a Gemini, mióta a Veo 3 elindult. A továbbiakban valószínűleg újabb lehetőségek jönnek majd a videogenerálóban, hogy a cég minél tovább fenntartsa az érdeklődést.