Megjelent egy új kínai nyelvi modell, ami állítólag versenyképes a Mythos ellen

MEGJELENT EGY ÚJ KÍNAI NYELVI MODELL, AMI ÁLLÍTÓLAG VERSENYKÉPES A MYTHOS ELLEN

A Z.ai által fejlesztett GLM-5.2 elvileg nagyon penge a biztonsági rések feltárásában, és sok tesztben teljesít kiválóan, miközben nyílt súlyozású.

Szécsi Dániel (DemonDani)

Időről időre feltűnnek olyan nagy nyelvi modellek, mesterséges intelligencia eszközök Kínában, amik képesek versenyre kelni a nyugati fejlesztésekkel. Ugyan az erőviszonyokat eddig még egyik ilyen eszköz sem tudta átrendezni, de mindenképpen érdemes ezekre odafigyelni. Most éppen a Zhipu AI, röviden Z.ai rukkolt elő egy erős modellel, a GLM-5.2-vel.

A nyílt GLM modell legfrissebb kiadása 753 milliárd paramétert használhat, de persze ennek csak egy töredéke lesz egyszerre aktív, ennek köszönhetően kiváló hatékonysággal fog szolgálni. Az eddigi elemzések szerint a kifejezetten komplex, “hosszú horizontú” autonóm programozási kihívásokban és a kiberbiztonsági fronton mozog igazán jól, ezekben tudja a legjobb eredményeket felmutatni.

A GLM-5.2-vel a Z.ai bevezeti az „IndexShare” nevű jelentős architektúra-optimalizálási eljárását. A hagyományos nagy nyelvi modellek működése közben a figyelem mechanizmusok újraszámítása rendkívül nagy kapacitást igényel, komoly terheléssel jár a terjedelmes dokumentumok, hosszú kontextusok esetén. Ebben hoz változást az IndexShare azáltal, hogy minden negyedik figyelemrétegben ugyanazt az indexelőt használja körforgásban.

A modell 1 millió tokenes kontextus ablakkal dolgozik, és kiemelte a fejlesztőcsapat, hogy az IndexShare révén ekkora adatmennyiség mellett majdnem harmad annyi számítási teljesítményre van szüksége tokenekre vetítve, mint a – meg nem nevezett – konkurenciának. De megannyi egyéb technológiát is felvonultat a hatékonyság fokozása érdekében. A GLM-5.2 jól skálázható, több érvelési szintet is megkülönböztet, így mindig az ideális gyorsasággal és pontossággal üzemelhet.

A felkapott SWE-Bench Pro keretében a GLM-5.2 már 62,1 százalékot képes teljesíteni, miközben a Gemini 3.1 Pro 54,2%-ot nyújt, a GPT-5.5 pedig 58,6%-nál jár, viszont az Opus 4.8 által elért 69,2%-tól még elmarad, szóval a Claude azért egy lépés előnyben van ezen a téren, cserébe sokkal drágább. Az ugyancsak népszerű Humanity’s Last Exam tesztben kiegészítők nélkül ugyan csak 40,5%-ot tud elérni, amivel elmarad a riválisaitól, eszközöket bevetve viszont már 54,7%-ot villant, amivel a Gemini és a GPT előtt, de ismét az Opus mögött zárt.

Arra egy a Wall Street Journalon megjelent beszámoló mutatott rá, hogy a kiberbiztonsági feladatokban elképesztően erősnek mutatkozik a Z.ai friss fejlesztése, amit részben mindenképpen aggasztrónak találnak a szakértők. Hiszen ez a modell nem olyan “jól szabályozottan” elérhető, mint az Anthropic csapata által fejlesztett Mythos és Fable modellek. A biztonsági kutatók szerint a GLM-5.2 hatékonyan tárja fel a sebezhetőségeket, sérülékenységeket.

Egyelőre még általánosan nincsenek az élen a távol-keleti modellek, de „Kína gondoskodik arról, hogy ez a különbség az idő múlásával egyre kisebb legyen” – mondta Lior Div, a 7AI kiberbiztonsági vállalat vezérigazgatója.

Mint a legtöbb kínai modell, a GLM-5.2 is egészen olcsón üzemeltethető, mivel arányaiban szerény számítási kapacitást igényel. A kínai cégeknek ez azért kulcsfontosságú, mert nehezebben férnek hozzá a nagy számítási kapacitáshoz, mint a nyugati versenytársaik.

Egy millió token feldolgozása itt mindössze 1,4 dollárba kerül, ugyanígy egy millió token létrehozását pedig 4,4 dollárból tudja le. A Geminiből a könnyűsúlyú 3.5 Flash modell ugyan nem sokkal drágább a feldolgozás során, 1,5 dollárt kóstál 1 millió token esetén, de a kimeneti oldalon már 9 dollárba kerül ez a mutatvány. A fent említett Mythos esetén pedig már 1 millió token feldolgozása is 10 dollár, a generálás pedig 50 dollárt kóstál ilyen mennyiségnél.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

MEGJELENT EGY ÚJ KÍNAI NYELVI MODELL, AMI ÁLLÍTÓLAG VERSENYKÉPES A MYTHOS ELLEN

TOP 5 AZ IPON-ON