Az elmúlt időszakban az MI ügynökök elkezdtek előtérbe kerülni, ezek azok az eszközök, amik már összetettebb feladatokat is képesek elvégezni a generatív mesterséges intelligenciával. Már az OpenAI is összehozta a saját megoldását, a ChatGPT Agentöt, ami meglehetősen sokat ígér, de azért még korlátozottabb annál, mint amilyennek a cég szeretné beállítani.
„A ChatGPT most már képes elvégezni a munkádat a saját számítógépeden, kezeli a komplex feladatokat az elejétől a végéig.” – jelentette ki az OpenAI. Olyan dolgokról beszélt a vállalat a bemutatóban, mint a böngésző kezelése, az irodai alkalmazások használata, valamint az olyan alapvető szolgáltatások, mint a naptár vagy a levelező elérése.
A ChatGPT Agent egy hosszabb építkezés eredményeként született meg. Az OpenAI mérnökei a korábban létrehozott technológiákat felhasználva hozták létre a minden eddiginél erősebb eszközt. Az alkalmazása során munkába fog állni a háttérben a Deep Research és az Operator is. Az Operator révén tudott eddig weboldalakon keresztül navigálni a ChatGPT, a Deep Research pedig arra szolgált, hogy mélyen elemezzen nagy mennyiségű adatot, és ebből akár kutatómunkát hozzon létre.
Teljesen természetesen lehet majd használni a ChatGPT ügynökét az OpenAI elmondása alapján. Bárki könnyedén használatba vezeti majd az új eszközt, annak ellenére, hogy ez rendkívül sokrétű és összetett működésre képes a neki kiosztott feladatok megoldása során. Egyszerű szöveges utasításokat kell majd neki adni, és „mindent” önállóan képes lesz lezongorázni.
Az OpenAI elmondása alapján az új MI ügynök tényleg hatékonyan fogja elvégezni a dolgát. Kezdetben még eléggé botcsinálta módon üzemeltek ezek az eszközök, viszont a friss termék már sokkal pontosabb, és jobb a problémamegoldó képessége.
Innentől kezdve a mesterséges intelligencia már ténylegesen képes lehet levenni az emberek válláról a terhet, nemcsak annyit tud segíteni, hogy kérdésekre válaszol, és kitalálja, hogy mit lehet vacsorára készíteni abból, ami otthon van. Persze ezek is nagy segítségnek számíthatnak adott esetben, de most már az OpenAI elmondása szerint meg tudja majd azt oldani, hogy megtervez egy kerti parti menüt 8-10 főre, és be is rendeli a szükséges eszközöket, alapanyagokat, akár azt is figyelembe véve, hogy mi az, ami van otthon.
Hogy milyen nyelvi modellt használ a ChatGPT Agent? Nos, ezt nem igazán lehet meghatározni, mert nem egy modellre hagyatkozik, hanem több különbözőt fog munkára a feladatok megoldása érdekében. Van, amikor az érvelési modellekre van szükség, de van olyan is, mikor egy általánosabb eszköz fog munkába állni, mikor milyen feladatot ad ki a számítógép előtt ülő felhasználó.
Mivel egyszerre több modellt tud használni, bizonyos teljesítménytesztekben egészen elképesztő eredmény képes elérni. Az egyik legnagyobb kihívást jelentő MI tesztben, a Humanity’s Last Examben 41,6%-os eredményt hozott össze a ChatGPT ügynök, miközben ebben eddig a Deep Research eszköz tartotta a rekordot 26,6%-kal, a Grok 4 modell pedig 25% felett teljesített egy hajszállal. A legkomplexebb matematikai tesztet (FrontierMath) 27,4%-os produkcióval tudta le, miközben ebben az o4-mini modell 6.3%-ot tudott felmutatni.
Kizárólag előfizetők tudják az ügynököt munkába állítani, a ChatGPT Plus, Team és Pro felhasználóknak biztosított az új lehetőség.