Shop menü

BEMUTATTA AZ ANTHROPIC A CLAUDE MI MODELL ÚJ GENERÁCIÓJÁT

A Claude 4 nagyon jól sikerült, erős lett programozásban és a fejlett érvelési képességei is kiemelkedőek.
Szécsi Dániel (DemonDani)
Szécsi Dániel (DemonDani)
Bemutatta az Anthropic a Claude MI modell új generációját

Az Anthropic folyamatosan dolgozik azon, hogy a Google, a Meta és az OpenAI nyomában maradjon a mesterséges intelligencia frontvonalában. Ennek eredményeként számolhatunk most be a Claude Opus 4 és a Claude Sonnet 4 modellek bevezetéséről. A cég szerint ezek a fejlesztések minden eddiginél magasabbra teszik a lécet több felhasználási területen is.

Az Opus és a Sonnet jelzők mutatják a modellek méreteiet, ahogy azt már korábban megszokhattuk a Claude esetén. A Claude Opus 4 egy minden eddiginél nagyobb modell lett az Anthropic kínálatában, ennek köszönhetően ez a vállalat legintelligensebb megoldása, és a legjobb olyankor, mikor valamilyen programozási feladatot kell megoldani, vagy érvelésben kell helytállni. Ezt a Claude már úgy tervezte, hogy képes legyen hosszú és összetett feladatokat végrehajtani, és mesterséges intelligencia ügynök munkafolyamatokban is helytáll.

A Claude Sonnet 4 már egy kisebb modell, és ez a cég elmondása alapján szignifikáns előrelépést jelent majd az eddig elérhető Sonnet 3.7 modellhez képest. Itt is a programozás és az érvelés az, amit kiemelt az Anthropic a fejlődés fő irányaként. Jó hír, hogy a válaszok pontosabbak lesznek, kevesebb hibát fog véteni a korábbi nyelvi modellhez képest az új generáció. Kifejezetten jó lesz már az utasításkövetés, kevésbé fog elkalandozni a figyelme a mesterséges intelligenciának, ezáltal csökken majd a hallucinációk valószínűsége is.

Kiemelte az Anthropic, hogy az SWE-bench tesztben, ami a programozási képességeket méri fel, első helyre jött fel az Opus 4 modell, és a Terminal-bench keretében sem talál legyőzőre jelenleg. Több nagy partnere tesztelte mostanra a Claude Opus 4 modellt, és mindenki maximálisan elégedett a fejlődéssel. A Rakuten arról számolt be, hogy 7 órán keresztül folyamatosan futtatott programozási feladatokat az új modellen, így győződött meg a képességeiről. A GitHub arra készül, hogy a Claude Sonnet 4 modellt tegye meg a Copilot új programozási ügynökévé.

Galéria megnyitása

Az Anthropic beszámolója szerint a két új modell majdnem ugyanolyan jó eredményeket képes elérni, ami főleg a Sonnet 4 esetében nagy szó. Ez kiváló hatékonysággal lesz alkalmazható a jövőben számos felhasználási területen. Úgy tud nagy pontosságot és jó teljesítményt felmutatni, hogy közben még a költségei sem magasak. A Claude Opus 4 esetében 15 dollárba kerül egy millió token bevitele és 75 dollár ugyanilyen adatmennyiség generálása, ezzel szemben a Claude Sonnet 4-nél 3 dollár 1 millió token feldolgozása, és csak 15 dollár 1 millió token létrehozása.

Mindent figyelembe véve akár 90%-os megtakarítás is elérhető lesz bizonyos feladatoknál a Claude 4 modellek használata esetén – jelentette ki az Anthropic.

A Claude 4 esetében a modellek jobb emlékező képességgel rendelkeznek majd, hatékonyabban fogják kezelni a memóriát. Kiterjesztett érvelésre lesznek képesek olyan eszközöknél, amik párhuzamos végrehajtást igényelnek. A fejlesztések révén az újdonságok jobban fognak viselkedni olyankor, mikor rövidítéseket, kiskapukat használhatnak a feladatok végrehajtásában a feladatok gyorsabb végrehajtása érdekében. Az Opus 4 képes lesz helyi programozási feladatok alkalmával létrehozni magának memória fájlokat, hogy a legfontosabb adatokra „emlékezzen” a későbbiekben.

Galéria megnyitása

Érdekes újítás, hogy az érvelési feladatokhoz kapcsolódóan a Claude 4 modelleknél már lesz egy összegzés az érvelésekhez is, amiket normál esetben általában nem tekintenek át a felhasználók. Ez az érvelésösszegzés a teljes válasz generálásában csak 5%-nyi időt vesz igénybe, de cserébe ennek az áttekintésével jobban megérthetik az emberek a válaszokat. De emellett persze továbbra is el lehet majd érni a teljes „gondolatmentet” is, erre az új fejlesztői mód nyújt majd lehetőséget.

Az Anthropic a Claude Opus 4 modell elérési lehetőségét biztosítja a Pro, a Max, a Team és az Enterprise Claude előfizetéseket használóknak egyaránt. Ezen felül a Sonnet 4 modell pedig még ingyenesen is kipróbálhatóvá válik a Claude chatbot keretében, ami mindenképpen egy remek hír.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére