Az elmúlt napokban valósággal záporoztak a friss nagy nyelvi modellek, és az Anthropic sem szeretne kimaradni ebből a bejelentés-áradatból. Előrukkolt a Claude 4.5 eddigi legnagyobb prémium változatával, az Opus 4.5-tel, miután a Claude Sonnet 4.5-öt és a Haiku 4.5-öt már korábban megismerhette a nagyközönség.
Az Anthropic kapcsán kijelenthető, hogy nincs annyira előtérben, mint a Google, az OpenAI, az xAI vagy akár a Meta, de meghatározó fontosságú szereplője a piacnak. Rengeteg vállalat dolgozik a Claude különböző verzióival, és különösen programozási feladatokra sokan alkalmazzák a szolgáltatást. Az új Opus 4.5 modell kapcsán is azt emelte ki elsősorban a vállalat, hogy mennyire hatékony munkára lesz képes professzionális szoftverfejlesztésben és fejlett MI ágensek kiszolgálásában.
„Ez az eddigi legintelligensebb modellünk, ami kombinálja a maximális lehetőségeket a gyakorlati teljesítménnyel. Ideális ez a Claude Opus 4.5 rendkívül összetett és speciális feladatok végrehajtására.” – szögezte le az Anthropic. Azt is elmondta a vállalat, hogy olcsóbban el lehet majd érni a korábbi funkcionalitást, amiből az következik, hogy a teljesítmény-fogyasztás arány tekintetében is sikerült érdemi előrelépést elérni. Ebben a teljesen új „erőfeszítés paraméter” jelenti a legfőbb segítséget.
Az Opus 4.5 erőfeszítés paramétere révén a felhasználó egyedülálló módon tudja majd kontrollálni, hogy mennyi tokent használjon fel a válaszok során. Lesz alacsony erőfeszítés beállítás, amikor az Opus 4.5 igyekszik majd tömör válaszokat adni, a közepes erőfeszítésnél az egészséges egyensúlyt igyekszik tartani, a magas erőfeszítésben pedig a legkomplexebb elemzéseket állíthatja elő részletes magyarázattal, ha éppen arra lenne szükség. A Claude API-n keresztül minden partner tudja majd szabályozni az új szempont alapján az Opus 4.5 működését.
A mesterséges intelligencia ágensalapú Computer use funkció az eddiginél több dologra lesz képes, bővül az általa ismert műveletek palettája, így ez még többször lesz bevethető. A cég belső mérései alapján az „ügynöki viselkedést” figyelő tesztekben és a programozásban remekel a Gemini 3 Pro és a GPT-5.1 ellenében az Opus 4.5. De korrekt módon az Anthropic azt is elismeri, hogy vannak olyan területek, amikben alulmarad. A tudományos érvelési képességet vizsgáló GPQA Diamond tesztben például az említett ellenlábasai mögött végez, de vannak egyéb hiányosságai is, viszont ettől függetlenül még magas minőséget nyújt, nagy lemaradása nincs.
Az Opus 4.5 a cég eredményei alapján nagyjából fele annyi esetben produkál bizonytalan, problémás viselkedést, mint a GPT-5.1 vagy a Gemini 3 Pro. Nagy megbízhatóság mellett lehet használni, hatalmas előrelépést jelent a Claude Haiku és Sonnet 4.5 modellekhez képest is. Prompt injection támadások ellen is jól teljesít az újdonság, a legerősebb támadásokat is jobban állja, mint a riválisaiként említett modellek.
Az Anthropic a legfrissebb befektetői kör alapján már 350 milliárd dolláros becsült piaci értékkel bír – olyan cégek vettek részt a mostani finanszírozási fordulóban, mint a Microsoft és az Nvidia. A feltörekvő cégek versenyében ezzel mondhatni a második helyet őrzi, hiszen az OpenAI bőven megelőzi az 500 milliárd dollár fölé taksált értékével, de magabiztosan megelőzi az xAI-t, ami ugyancsak mostanában lett 230 milliárd dollárra értékelve.