A napokban számoltunk be arról, hogy megjelent a ChatGPT-ben egy teljesen új alapokra helyezett képkészítő funkció. Ezt a vállalat ingyenesen is hozzáférhetővé tette a friss fejlesztést, most azonban visszakozik, ami elég rosszul veszi ki magát.
A ChatGPT-ben hosszú ideje van már képgenerálási lehetőség, amit ingyenesen is lehet használni. Talán nem mindenki tudja, hogy amikor képet alkot a mesterséges ingelligencia chatbot, akkor azt nem ugyanazzal a modellel teszi, mint amivel a szövegeket generálja. Eddig a cég külön erre tervezett DALL-E nyelvi modellje teljesített szolgálatot a képgenerálás esetén. Viszont a napokban ez megváltozott, színre lépett a GPT-4o alapú képkészítő. A korábbi hírünkben részletesen leírtuk, hogy ez milyen jellegű változásokkal jár, a lényeg most az, hogy ennek az elérését részben visszavonta a cég.
Kevesebb mint egy napig lehetett előfizetés nélkül is használni a GPT-4o alapú képgenerálót, és nem tudni, mikor lesz erre ismét módja a felhasználóknak.
Úgy jelentette be az OpenAI az újdonságot, hogy ezt mindenki használhatja, de nagyon gyorsan meggondolta magát a cég. Ez meglehetősen kellemetlen helyzetet szült. Sam Altman az ügy kapcsán arról beszélt, hogy nem jól mérték fel azt, hogy mennyire lesz népszerű a friss lehetőség.
„A képek a ChatGPT-ben sokkal népszerűbbek lettek, mint ahogy arra számítottunk (és azért elég magas várakozásaink voltak)” – jelezte az X felületén Altmann. „Az ingyenes fiókokkal rendelkezők esetében ezért el kell tolnunk a bevezetést egy időre.”
Az OpenAI-nál nem a mostani az első eset, hogy ilyen „problémával” szembesülnek. Nem tűnik túl professzionálisnak, hogy a vállalat rendszeresen rosszul méri fel az új lehetőségek bevezetésénél várható helyzetet. Korábban Altman például arról is beszélt, hogy a bizonyos esetekben veszteséges volt még a 200 dolláros ChatGT Pro előfizetés biztosítása is, mert túl nagy szabadságot adtak ezeknek a fiókoknak. Hogy mikor fog újra visszaállni az ingyenes fiókoknál a GPT-4o alapú képgeneráló elérése? Nos, erről semmit nem közölt a vállalat első embere.
A közösségi médiát rengeteg GPT-4o modellel előállított kép árasztotta el rövid idő alatt. A Studio Ghibli stílusában átszerkesztett képek különösen felkapottak lettek, ezt a trendes még Sam Altman is meglovagolta, lecserélte a profilképét egy az adott stílusban „másolt” képre. A GPT-4o alapú képgenerálás sok jó lehetőséget tartogat, de innentől már csak azoknak, akik fizetnek a szolgáltatásért.
Az OpenAI egyébként nagyon szigorúan korlátozza a képgenerálást azoknál, akik nem fizetnek a szolgáltatásért. Napi szinten mindössze három darab képet lehet létrehozni ingyenes fiókkal. Viszont ha százmilliós nagyságrendben szeretnének az emberek képeket generálni, akkor már ez is nagy terhelést jelent. Altman nem mondja ki, de valószínűleg azért kellett ezt a lehetőséget visszavonni, mert túl sokba került.
A GPT-4o alapú képgenerálás költségeiről a cég nem beszélt, mikor bejelentette a fejlesztést, de azt érezhetik a felhasználók, hogy tovább tart egy kép megalkotása, mint a DALL-E modell használatával. Mivel nagyobb lehet a számítási kapacitás igénye, sokkal többe kerülhet az OpenAI-nak.
A GPT-4o eleve az egyik legdrágább modellje a cégnek, és itt nem egyszerű szöveget kellett létrehoznia. Szövegnél és hangnál 1 millió token generálása 10 dollárba kerül ennél a modellnél, a beviteli oldalon pedig 2,5 dolláros költségről beszélhetünk 1 millió tokenre vetítve. A képekről egyelőre nem nyilatkozott, de azt tudjuk, hogy a DALL-E 3 0,04 és 0,12 dollár között mozog a képek létrehozásának költsége felbontástól és minőségtől függően.