Az Anthropic új nyelvi modellje jobb, mint a GPT-4 vagy a Gemini Ultra

AZ ANTHROPIC ÚJ NYELVI MODELLJE JOBB, MINT A GPT-4 VAGY A GEMINI ULTRA

A Claude állítólag hatalmas fejlődésen ment keresztül, és szinte már olyan jól tudja majd értelmezni a dolgokat, mint egy átlagos ember.

Szécsi Dániel (DemonDani)

Az OpenAI és Microsoft páros, valamint a Google árnyékában az Anthropic kitartóan fejleszti a nagy nyelvi modelljeit és a generatív MI-t alkalmazó eszközeit. A vállalat most hatalmas ígéreteket fogalmazott meg, és teszteredményeket is hozott, hogy alátámassza a meglepő állításait. A Claude modell új generációja állítólag rendkívül ütőképes lett.

A GPT-4 és a Gemini számára ellenfelet állító Claude 3 egy multimodális megoldás, ami képes értelmezni többféle adatformát, és különböző méretekben lehet majd elérni. Három verzióban jön, mint a Google Geminije, és ezek eltérő lehetőségeket biztosítanak majd.

Haiku, Sonnet és Opus névvel illeti a Clude harmadik generációjának különböző kiviteleit az Anthropic.

„A Claude 3 Opus az eddig legnagyobb és legintelligensebb modell lesz a piacon” – jelentette ki a társaság. Arra nem derült fény, hogy a paraméterek számát tekintve hogy áll ez a megoldás, de nem meglepő, hogy ezt titkolja az Anthropic, mert a riválisai sem feltétlenül verik ezt nagy dobra. A Sonnet és az Opus modellek már üzemelnek, ezeket el lehet majd érni API révén is. A Haiku viszont még nem készült el, ennek a fejlesztése egyelőre folyamatban van.

Elsődlegesen chatbotok alapjául szolgálhat majd a Claude 3, és kifejezetten jó lesz az automatikus kiegészítési feladatokban, és a rendelkezésére bocsájtott adatok feldolgozásában. Nagy mennyiségű szöveget lehet majd bevinni a modell számára, és abból feltehetőek neki változatos kérdések, amikre gyorsan és pontosan adhat választ. Kevesebbet fog hezitálni a konkurenseinél és megbízhatóbban teljesíthet a legtöbb mesterséges intelligenciák számára összeállított tesztben.

Korábban a Claude modelleknek volt egy olyan hátránya, hogy az átlagosnál többször utasították el a válaszadást akkor is, ha a feltett parancsok semmilyen káros dolgot nem tartalmaztak. Ez azért volt, mert gyengén értelmezte és ismerte fel a kontextusokat, így hajlamos volt az embereket félreérteni, de ennek mostantól szinte teljesen vége. Míg a Claude 2.1 nagyjából az esetek 25%-ában hajlamos volt a dolgokat rosszul értelmezni, addig a Claude 3 verziótól függően 8% körüli értéket is elérhet.

10 különböző MI teszteredményt villantott az Anthropic a bejelentésében, és ezekben a Claude 3 Opus magabiztosan übereli a GPT-4-et, és a Gemini Ultrát is. Az OpenAI és a Google fejlesztései közül összességében a Gemini Ultra teljesít jobban, ez a második a Claude 3 Opus mögött. A legkülönfélébb megmérettetéseket válogatta össze az Anthropic, hogy bizonyítsa a fejlesztése képességeit. Matematika, érvelés, kódolás, mindenből volt egy kicsi az összeállításban, szóval tényleg nagyon meggyőző a modell tudás.

A Claude 3 Sonnet kétszer gyorsabban fog üzemelni mint a Claude 2 vagy 2.1 korábban. Értékesítési rendszerekben segédként vagy gyorsan megválaszolásra szoruló kérdéseknél ezt nagyon hatékonyan lehet majd hasznosítani, szinte azonnal képes lesz válaszolni, amire csak tud. Ennek köszönhetően élmény lesz az alkalmazása, ha a képességeiben valamivel el is marad az Opustól. De még a Sonnet is sokszor megelőzi a GPT-4-et, a GPT-3.5-öt pedig magabiztosan utasítja maga mögé, és még a Gemini Pro sem jelent számára komoly ellenfelet.

Fentebb már említettük, hogy multimodális a Claude 3, de ez lesz a legnagyobb gyengéje egyelőre, legalábbis az említett ellenfeleihez képest. Bementként képes a szöveg mellett képeket kezelni, kimenetet viszont csak szöveges formában tud produkálni. Itt nincs képgenerálás, hangot és videót pedig még egyáltalán nem képes kezelni. A szöveges formátumú adatokkal tud kiválóan zsonglőrködni a Claude, de a tervek között szerepel a multimodális működés fejlesztése.

Fontos, hogy az Anthropic megtartotta a Claude 2.1-nél vezetett 200 000 tokenes kontextusablakot. Ennek köszönhetően több száz oldalas könyvet is fel tud dolgozni a mesterséges intelligencia és abból lehet majd kérdezni. Még 175 ezer token felett is átlagos pontossággal fog teljesíteni, persze azért fokozatosan csökken minimális mértékben a pontossága a hosszabb adattömegek esetén.

Azt is hozzátette a vállalat, hogy felelősségteljes dizájnt alkottak, a lehető legmagasabb szintű megbízhatóságra törekszik működése során az összes Claude 3 modell. A vállalat saját biztonsági besorolásában ASL-2 szinten van, és a tervek között szerepel, hogy a jövőben már az ASL-3 szintet is elérje a cég a modelljeivel. A „vörös csapatok” folyamatosan vizsgálják a modelleket a gyengéit, sérülékenységeit és a veszélyeit kutatva.

Azt is megtudhattuk a vállalat beszámolójából, hogy 15 dollárba fog kerülni a Claude 3 Opus esetén 1 millió token feldolgozása, és 75 dollár lesz a költsége ugyanekkora mennyiségű információ generálásának. A Claude 3 Sonnet pedig mindössze 3 dollárból képes lesz 1 millió tokent feldolgozni, és 15 dollárba kerül majd 1 millió token generálása összesen.

Az Anthropic abban bízik, hogy változatos célokra fogják felhasználni az új nyelvi modelleket. Az Opus feladat automatizálásnál, kutatási és fejlesztési projektekbe, elemzési feladatokban egyaránt jól teljesíthet. A cég elképzelései szerint nagy segítséget jelenthet kutatási adatok kiértékelésében, orvosi kutatásában és hipotézisek vizsgálatában. Pénzpiaci célokra is fel lehet majd használni, piackutatásban, előrejelzések összeállításában egyaránt remekelhet. A Sonnet pedig olyan egyszerűbb feladatokat tud majd megoldani hatékonyan, amivel időt spórol a felhasználóknak, például minőségellenőrzést lehet vele futtatni, és képes programozásban is támogatást nyújtani.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

AZ ANTHROPIC ÚJ NYELVI MODELLJE JOBB, MINT A GPT-4 VAGY A GEMINI ULTRA

TOP 5 AZ IPON-ON