Megújult a ChatGPT képgeneráló funkciója

MEGÚJULT A CHATGPT KÉPGENERÁLÓ FUNKCIÓJA

A továbbiakban már egy új modellre támaszkodik a rendszer, ennek pedig több előnye is lesz a végeredményre nézve.

Szécsi Dániel (DemonDani)

Az OpenAI folyamatosan dolgozik azon, hogy a ChatGPT vonzó maradjon a felhasználók számára, ezért rendszeresen szállítja az újításokat. Most éppen az egyik legnépszerűbb lehetőséget, a képgenerálást emelte új szintre, méghozzá egy kicsit meglepő módon. Nem dedikált képi modellt használ ehhez.

Sokféle modellt alkotott már az OpenAI az elmúlt évek folyamán, az utóbbi időben már elsősorban az érvelő modellek kerültek a figyelem középpontjába, de van a cégnek dedikált megoldása képek kezelésére. A DALL-E modell is sokat fejlődött a bevezetése óta, de most a cég úgy döntött, hogy ezt a kispadra ülteti. A GPT-4o képes lesz innentől képeket is létrehozni. Ez egy omnimodális eszköz, ami még tavaly futott be, és a jelek szerint többet lehet belőle kihozni, mint azt gondoltuk volna.

Eddig csak szövegek generálására használta az OpenAI a GPT-4o modellt, de az omnimodális működésnek köszönhetően ez bármilyen anyagot képes lehet előállítani amellett, hogy feldolgozni fel tud képet, szöveget, hangot és videót is. Ha kell, létre is hozhat ilyen tartalmakat, és most már láthatják a felhasználók, hogy teljesít akkor, ha a képgenerálás erre van bízva.

Az OpenAI elmondása alapján a GPT-4o alapra helyezett képalkotási funkciónál szembetűnő lehet majd a felhasználók számára, hogy nagyon jól tudja tartani a kontextust, összetett instrukciókat is pontosan tud leképezni a mesterséges intelligencia. A cég ezt azzal mutatta be, hogy egyetlen képre 16 különböző kisebb grafikát helyezett fel egyetlen összetett utasítással. A pontosság mellett egyéb erénye is van az új megoldásnak.

Külön kiemelte az OpenAI, hogy sokkal jobb lesz majd a szövegek renderelése.

Mint az ismeretes, jelenleg a legtöbb képgenerátor elvérzik azon, ha valamilyen szöveget kell a képekre tennie. Eltérnek egymástól a betűk, szétcsúsznak az illesztések, nem tudja tartani a rendszer a vonalakat. A szövegek buktatják le a legtöbb esetben a hamis képeket. A GPT-4o alapra helyezett újdonság viszont ebből a szempontból már sokkal jobb lesz. Rövidebb szögekkel már tényleg nagyon jól dolgozik, de azért hosszabb, összefüggő szövegekbe azért még beletörhet a bicskája.

Elárulta az OpenAI, hogy az új megoldás már részleteiben alkotja meg a képeket, nem az egészet egyszerre, mint ahogy a legtöbb eddigi képgeneráló ezt próbálta megoldani. Ennek köszönhetően tud pontosabb lenni. A cég szerint ilyen formában a ChatGPT képgenerátora már hatékonyabb munkatársnak bizonyulhat. Több területen lehet majd felhasználni az általa létrehozott képeket.

A ChatGPT továbbra is lehetővé teszi a DALL-E modell használatát, ha valakinek arra lenne szüksége. Különböző eredményeket nyújtanak a modellek, és vannak olyan helyzetek, amikben a DALL-E azért még jobban teljesíthet, és gyorsabb is. A GPT-4o alapú képgenerálás időigényesebb, ami munkában például zavaró lehet. A DALL-E modellre váltáshoz külön be kell állítani a szövegdoboz alján található opciók között, hogy ezt szeretné igénybe venni az ember.

Az új képgeneráló mindenkinek elérhető, a ChatGPT Pro előfizetők és az ingyenes elérést „koptatók” is próbára tehetik ezt. A ChatGPT limitálja, hogy mennyi képet hozhat létre az ember a különböző csomagokkal. Akik ingyenesen használják a funkciót, azok néhány kép létrehozásával ellőhetik a napi lehetőségeiket, és azt is hozzá kell tenni, hogy a limit ugyanennyi a DALL-E és a GPT-4o esetén.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

MEGÚJULT A CHATGPT KÉPGENERÁLÓ FUNKCIÓJA

TOP 5 AZ IPON-ON