A nagy nyelvi modellek és a generatív MI eszközök fejlesztése az utóbbi hetekben még a korábbinál is magasabb szintre pörgött. Szinte mindegyik élmenő újdonságokkal állt elő, és bizony ez a helyzet az OpenAI-nak fáj leginkább, mert a riválisok látványosan kezdik ledolgozni a hátrányukat, a Google pedig esetenként már akár lépéselőnyben is lehet.
Óriási sikert aratott a Google a Nano Banana képgenerálóval, és időközben már előrukkolt a Nano Banana Próval, ami tényleg képes olyan felvételeket előállítani, amikről már szinte lehetetlen megmondani, hogy mesterséges intelligenciával készültek. Erre igyekszik most válaszolni az OpenAI a teljesen megújuló ChatGPT Images bevetésével.
A színfalak mögött a GPT Image 1.5 modell állt munkába, ami a cég „új csúcskategóriás képgeneráló modellje”.
A fejlesztéseknek köszönhetően az OpenAI új képkészítője az eddiginél pontosabban követi majd a felhasználók instrukcióit, miközben mégis jobb lesz a kreativitása, ami akkor fog jól jönni, ha kevés információt kap. A képszerkesztési kéréseket már teljesen más színvonalon lesz képes abszolválni, mint korábban, és sokkal gyorsabban dolgozik, akár negyedannyi idő alatt létrehozhatja a képeket, mint az előző modell.
A GPT Image 1.5 modellt használva lehet majd hatékonyan kombinálni több képet, és pontosabban tudja majd többnyire változatlanul tartani a képek bizonyos részeit több szerkesztési folyamaton keresztül. Elvileg minden eddiginél jobb lesz a szövegek renderelése is, valamint a képek apróbb részleteit is magas minőségben tudja majd kidolgozni az eszköz, szóval egy csoportképen a kisebb arcok sem fognak annyira szétesni, mint korábban.
Az OpenAI a ChatGPT felületén létrehozott egy új Images fület az oldalsávon. Itt nagyon látványosan igyekszik tálalni az összes olyan lehetőséget, amit a képekkel kapcsolatosan össze tud szedni. A képernyő tetején az instrukciókat már elég begépelni, nem kell beállítani, hogy képet szeretne létrehozni az ember. Egyből alatta felkínál a platform kulcsrakész stílusokat meglévő fotók szerkesztéséhez. Ez alá pedig egy felfedező szekció került, ahol véletlenszerű ötleteket próbál adni a ChatGPT.
Újítás az is, hogy egy nagy galériában a felhasználók elé tárja a ChatGPT az összes addig generált képet. Ennek azonban könnyen lehet, hogy az emberek nem feltétlenül fognak örülni. Úgy villantja meg az összes korábbi munkát a ChatGPT, hogy gyors törlési vagy archiválási lehetőséget sem nyújt. Csak áttekinteni, letölteni vagy megosztani lehet a korábbi alkotásokat az Images lapról.
Érdekes módon az OpenAI a bejelentésben arról beszélt, hogy ez az új képgeneráló eszköz kifejezetten a vállalkozások számára ideális módon fejlődött. Valószínűleg emögött az állhat, hogy a cég igyekszik az üzleti előfizetők táborát gyarapítani, akiktől jelentősebb bevételre tud szert tenni. Hiszen látni kell azt, hogy egyre nagyobb a nyomás az OpenAI-on.
A befektetők elképesztő mennyiségű pénzt pumpáltak a mesterséges intelligencia szektor élmenőjébe, és már egyre többen szeretnék azt látni, hogy jelentősebb emelkedésnek indul a cég forgalma.
Az OpenAI az előző évben nem tudta teljesíteni a bevételi célját, 5 milliárd dollár helyett csak 3,7 milliárd dolláros forgalma volt. Ennek ellenére az idei évnek úgy ment neki, hogy közel 13 milliárd dolláros bevételi célt tűzött ki maga elé. Sokan úgy vélik, hogy ezt megint képtelen lesz megugrani. Korábbi információk szerint 2025 első felében 4,3 milliárd dolláros forgalma volt a cégnek, ami szép növekedés, de nem igazán látszik, hogy tudná 2025 második felére megduplázni a forgalmát, hogy elérje a befektetőknek belengetett célt.
Noha az OpenAI igyekszik felkelteni a nagy előfizetők érdeklődését, a GPT Image 1.5 modell mindenki számára elérhető lett. Az összes felhasználó ezzel dolgozhat mostantól, ha képeket akar létrehozni a ChatGPT-vel.