Az OpenAI kapcsán mindig vannak túlzott elvárások és alaptalan pletykák, ezt valószínűleg senkinek nem kell bemutatni, aki olvassa ezeket a híreket. Korábban szárnyra kapott egy pletyka arról, hogy a cégnél dolgoznak egy teljesen új modellen, ami mindent megváltoztathat az érvelés terén, újszerű működést hoz, és Strawberry, vagyis Eper néven hivatkoznak rá belső körökben. Voltak, akik már ezt is kacsának vélték, de az új modell most tényleg színre lépett.
A Strawberry végül egyelőre csak o1 névre hallgat, és olyan korai stádiumban van a fejlesztése az OpenAI álláspontja szerint, hogy még csak „preview” stádiumban van. Ennek ellenére mást most egészen elképesztő eredményekről számolt be az újdonság kapcsán a vállalat, ami tényleg az alapjaiban tér el a GPT-4o-tól.
Az új modell más logika alapján dolgozik, mint az eddigi megoldások, és éppen ezért nem feltétlenül jobb mindenben élből, de összességében az emberek sokkal természetesebben dolgozhatnak vele azáltal, hogy emberszerű a gondolatmenete. Az OpenAI korábban már beszélt arról, hogy a mesterséges intelligenciánál szeretné azt elérni, hogy emberi legyen, ehhez viszont sok módosításra van szükség. Nos, az o1 már az új irányba mutat. Több lépéses feladatok megoldásában, programozásban, többszörösen összetett kérdésekben sokkal jobb, mint a GPT-4o.
Az o1 a betanítását tekintve is teljesen különbözik a GPT-4o modelltől, de erről csak ködös részleteket árult el a kutatásvezető, Jerry Tworek. „Egy teljesen új optimalizációs algoritmussal lett tréningezve, és a tanításhoz használt adatcsomag is kifejezetten ennek megfelelően lett kialakítva.” – emelte ki a vállalat illetékese.
A GPT-4o esetében a tanítás arra ment rá, a mintákat betanulja a rendelkezésre álló adatokból, és ezt kihasználva nagyon gyorsan tud válaszolni. Ezzel szemben az o1 esetén a problémamegoldási képességet sajátította el olyan tanulási technikával, mint amit az emberek is alkalmaznak, például jutalmazáson/büntetésen keresztül. A folyamat során az o1 megoldási láncot használ, hasonlóan az emberi gondolkodáshoz, de emiatt lassabb lesz, a pontossága viszont javul.
Mi a helyzet a hallucinációkkal? Nos, az o1 hiába egy teljesen új modell, még mindig jellemző rá, hogy képes teljes meggyőződéssel téves, akár teljesen alaptalan információkat közölni, viszont nem arról van szó, hogy ugyanúgy hibázik. „Azt látjuk ennél a modellnél, hogy kevesebbszer fordul elő a hallucinálás. De nem jelenthetjük ki azt, hogy megoldottuk volna ezt.” – emelte ki Bob McGrew, az OpenAI kutatási igazgatója.
Bob McGrew azt is elmondta, hogy bár matematika szakon végzett az egyetemen, az o1 képes nála hatékonyabban megoldani az összetett számítási feladatokat is. Feladták neki a Nemzetközi Matematikai Diákolimpia tesztsorát, ami az egyik legmagasabb szintű minősített vizsga, és összemérhetetlenül jobban teljesített, mint a GPT-4o. Az o1 modell 83%-os eredményt hozott össze, miközben az eddigi legfejlettebb GPT-4o 13 százalékkal elvérzett. Messze túlmutatnak a képességei egy érettségi tesztsor megoldásán.
Programozási verseny feladatokat is adtak az o1-nek, és a Codeforces kihívást teljesítőknek 89 százalékánál jobban szerepelt. A határok pedig még messze vannak, a következő kihívás az, hogy PhD-s hallgatóknak felállított teszteket teljesítsen fizika, kémia és biológia szakterületeken.
Az o1 neve onnan ered, hogy mivel ez a modell teljesen másként működik, új utat képvisel a lehetőségek tekintetében, úgy gondolták, hogy visszaállítják a számlálót 1-re. McGrew megjegyezte, hogy szerinte a névadásban nagyon rosszak, de bízik abban, hogy ez a név már az első lépés abba az irányba, hogy ebben is jobbak legyenek. Nos, hát mindenki döntse el maga, hogy az o1 név mennyire sikerült jól.
A különböző nyelvi modellek költségei eléggé széles skálán mozognak, és az o1 az extrémdrága kategóriát képviseli. Az OpenAI már a GPT-4o-t is eléggé drágán méri, 1 millió token feldolgozása 5 dollár, kimenetben pedig ugyancsak 1 millió token 15 dollárt kóstál. Ehhez képest a GPT-4o mini modellnél 0,15 dollár 1 millió token feldolgozása, és 0,6 dollárt kóstál 1 millió token generálása. Az o1 esetén már a bementi oldalon 15 dollárt kóstál 1 millió token, a kimenetnél pedig 60 dollárba kerül ekkora adatmennyiség.
Annak érdekében, hogy az o1 is elérhetőbb legyen, az OpenAI azonnal elindította az o1 mini modellt is, ami a képességeit tekintve valamelyest korlátozottabb, kevésbé pontos is, de cserébe elfogadhatóbb áron üzemel. Ennél 3 dollár 1 millió token bevitele és 12 dolláros költséget jelent a kimeneti oldalon 1 millió token. Az o1 mini biztosítja majd azt, hogy a szélesebb közönség is megismerkedhessen a modellben rejlő lehetőségekkel.
A ChatGPT Plus és a ChatGPT Team előfizetők már kipróbálhatják az o1 preview modellt és az o1 minit is, mostantól, hamarosan pedig minden más előfizetőnek biztosított lesz ez a lehetőség. Az OpenAI korlátozza az elérést, de ez nem új, erre számítani lehetett. A vállalat még azt is elmondta, hogy szándékukban áll az o1-et ingyenesen is elérhetővé tenni, de arról nem esett szó, hogy ezt mikorra oldhatják meg. Azt viszont hozzátették, hogy csak az o1 mini modell jöhet szóba ingyenesen, érthető okból.