Az OpenAI a ChatGPT révén robbant be a köztudatba igazán, de a cég képeket generáló megoldása, a DALL-E már korábban megjelent. Ezt a szolgáltatást is folyamatosan fejleszti a vállalat egyebek mellett, és most elkészült a DALL-E harmadik kiadása, ami sok szempontból hoz komoly változásokat.
A DALL-E egy olyan képgeneráló volt, ami parancsszavak alapján alkotta meg a kívánt képeket, majd jött a DALL-E 2, mely sokak szerint nem éppen a jó irányba változott, számos esetben nehezebb volt vele dolgozni, mint az előddel. Az OpenAI a DALL-E 3-mal éppen ezért egy teljesen új irányba indult el, sokkal könnyebben és pontosabban megérti majd a szolgáltatás, hogy a felhasználó mit szeretne látni.
Annak érdekében, hogy a DALL-E új generációja gördülékenyebben használható legyen, integrálták a ChatGPT-vel.
Lehetősége lesz a felhasználóknak arra, hogy a ChatGPT segítségével dolgozzák ki a megfelelő parancsokat a DALL-E használatához. Miközben a szolgáltatást továbbra is lehetőség lesz a klasszikus formában is kezelni a képgenerálások alkalmával, szóval igyekeztek úgy előre lépni, hogy senkinek ne kelljen kompromisszumokat kötnie a szolgáltatás használata során.
A DALL-E volt az első képgeneráló megoldás a publikum számára, már 2021 elején hozzáférhető volt, megelőzve a Midjourney-t és a Stability AI-t. Azonban nem ment túl jól a sora, a fejlesztések nem jó irányba vitték el, és igazából ma már sokkal többen használják azokat a szolgáltatásokat, amik később születtek. Az OpenAI szeretne ezen változtatni, ezért meghallgatták a kritikákat, és ennek megfelelően alakították át a DALL-E 3-at.
A friss verzió először a ChatGPT előfizetők és az az új ChatGPT Enterprise felhasználók számára lesz elérhető, tehát azoknak, akik fizetnek az OpenAI rendszereiért. Októberben fog befutni. A vállalat azt mondta, hogy ingyenesen is elérhető lesz házon belül, de azt nem tette hozzá, hogy mikor. A Microsoft azonban bejelentette, hogy a Bing keretében ki lehet majd használni a DALL-E 3-at.
A Bing idén hatalmas fejlődésen ment keresztül, egy keresésre használható, hatékony chatbot lett belőle, és a redmondiak próbálnak minél több funkciót belesűríteni. Hamarosan már a DALL-E 3 szolgáltatásra támaszkodva hozhatnak létre képeket közvetlenül a beszélgetések felületén. A Microsoftnak van különálló képgenerálója, ami már megy a Bingen belül, de ez egy lényegesen komplexebb megoldás lesz, ha elkészül.
Hamarosan jönni fog ez a fejlesztés, de közelebbit a Microsoft sem mondott. A vállalat a Bing chatbot mögött a GPT-4 nagy nyelvi modellt alkalmazza, ami a ChatGPT előfizetőknek is elérhető, szóval ezáltal lesz megvalósítható, hogy a két generatív MI képes legyen együttműködni.
Az OpenAI elmondta még a DALL-E 3 kapcsán, hogy sokkal biztonságosabb lesz, mint korábban volt. Rengeteg erőfeszítést tettek a fejlesztők annak érdekében, hogy a platformot ne lehessen használni erőszakos és zaklató anyagok megalkotására. Minden fronton újabb védelmi megoldások jelentek meg, a betanításra használt anyagok terén és a parancsszavak kezelésében is.
Érdekes módon a DALL-E 3 stílusok másolására sem lesz a legalkalmasabb. A cég szerint az embereket rá kell vezetni arra, hogy egyedi stílusokat hozzanak létre, és ne más művészeket próbáljanak utánozni a saját elképzeléseiket felhasználva. Főleg az élő és ma is alkotó művészeket szeretnék védeni. Persze valójában ezen a téren az lehet a cél, hogy elkerüljék a jogi támadásokat, ugyanis nem egy perben próbálták már támadni az OpenAI-t a DALL-E miatt (is).