Az OpenAI tavasszal jelentette be a GPT-4 nagy nyelvi modellt, és a vállalat szakemberei azóta sem pihentek, most előrukkoltak ennek a szó szerint felturbózott verziójával, a GPT-4 Turbóval. Ez nem egy teljesen új LLM, hanem egy kiterjesztése lesz a GPT-4-nek, ahogy arra igazából a neve is utal. Azonban ezzel együtt is számos szempontból hoz előrelépést.
Nagyon úgy fest, hogy az OpenAI úgy érezte, hogy muszáj válaszolnia az xAI által bejelentett Grok nagy nyelvi modellre és generatív MI technológiára, mert abban biztosak lehetünk, hogy nem véletlenül jöttek ezek szinte kéz a kézben. A Grok több szempontból is a GPT-4 nyomában járt, a GPT-4 Turbo azonban megmutatja, hogy nem eszik olyan forrón a kását, és az OpenAI is dinamikusan halad a fejlesztésekkel.
A Grok-1 és a GPT-4 például hasonlóképpen 8192 tokenben meghatározott kontextusablakkal üzemelt. Ez azt jelenti, hogy ilyen hosszú beszélgetésekben tudta a rendszer folyamatosan követni a témát, és nem kellett neki ismételgetni a beszélgetésekben korábban elhangzottakat. Nos, az OpenAI a GPT-4 Turbo esetén úgy döntött, hogy közel 16-szor nagyobb kontextusablakot nyit: már 128 ezer token lesz a limit.
Lényegében úgy kell ezt elképzelni, hogy a GPT-4 Turbo használata esetén a generatív MI egy olyan hosszú beszélgetésben sem fogja elveszíteni a kontextust, ami egy átlagos könyv formájában 300 oldalas kiadványt tenne ki. Soha nem látott méretű lesz ebben az esetben a kontextusablak, korábban az OpenAI a GPT-3.5 Turbo esetén kísérletezett ezzel, de ott is csak 32 ezer token volt a maximum.
Remek hír, hogy a GPT-4 Turbo sokkal hatékonyabb is lett, és ennek köszönhetően töredéke áron lehet majd üzemeltetni a fejlesztőknek. 0,01 dollárba fog kerülni 1000 token feldolgozása, míg a GPT-4 esetén ugyanez a mutatvány még 0,03 dollár költséggel járt. Szóval a harmadába kerül majd ebben az esetben futtatni a különböző projekteket. Ennek köszönhetően talán az OpenAI olcsóbb előfizetéseket is létrehozhat a jövőben.
Szöveges és képi anyagokat is be lehet majd vinni információként a beszélgetések során. Integráltan jelen lesz a DALL-E 3 is a háttérben, de ez nem új dolog. Az viszont új lesz, hogy az adatbázis már 2023 áprilisáig terjed ki.
Lényegesen frissebb lesz a tudásanyaga a GPT-4 Turbónak, ha naprakésznek éppen még nem is nevezhető. Az ukrán-orosz katonai konfliktusról például így már tudni fog, eddig erről nem volt képes nyilatkozni, hiszen 2021 végéig terjedtek az infók, amikből tanult. Persze már van Bing kiterjesztés, amivel ezt a limitet lényegében meg lehet kerülni, de az online térből merített adatokkal azért még több gondja van, mint azzal, amit a feltanítására célirányosan alkalmaznak.
A GPT-4 Turbo esetén a felhasználók más lényegesen bonyolultabb parancsokat, kéréseket is megfogalmazhatnak majd a generatív MI számára, nagyobb rutinnal tudja majd ezeket értelmezni. Programozásban is hatékonyabb munkatársnak bizonyulhat majd az újdonság.
Fontos bejelentés volt még az OpenAI részéről az is, hogy a Microsoft és a Google nyomdokain elindulva már létrehoz egy szerzői jogi védelmi rendszer, melynek keretében az esetleges perekben kártalanítást vállal. Copyright Shield névre hallgat az új szolgáltatás, amit elsődlegesen az üzleti partnereknek fog biztosítani a vállalat. A ChatGPT Enterprise díjcsomagnál kerül ez bevezetésre.