Shop menü

ITT VAN A GROK-3, ÉS ELON MUSK SZERINT SOK SZEMPONTBÓL EZ A LEGJOBB NYELVI MODELL

A Grok-3 többféle változatban jön, szédületes számítási kapacitásokat megmozgatva a dollármilliárdokat felemésztő Colossusnak köszönhetően.
Szécsi Dániel (DemonDani)
Szécsi Dániel (DemonDani)
Itt van a Grok-3, és Elon Musk szerint sok szempontból ez a legjobb nyelvi modell

Az xAI bejelentette a Grok-3 nyelvi modellt, ami több különböző változatban lesz hozzáférhető, és hatalmas számítási kapacitással lett megtámogatva, hogy az eddiginél sokkal jobb teljesítményről tudjon gondoskodni. Elon Musk az újdonság kapcsán elmondta, hogy az X Premium+ előfizetőknek lesz először elérhető az új fejlesztés, de ennek emelkedik majd az ára.

2023-ban a frissen megalapított xAI néhány hónap alatt rakta össze az első nagy nyelvi modelljét és indította el a chatbot szolgáltatását generatív MI technológiával. Ezt követően 2024 augusztusában jelent meg a Grok-2, ami már egy lényegesen fejlettebb LLM eszköz lett több lehetőséggel, jobb skálázódás mellett. Egyike volt az az első Mixture-of-Experts (MoE) architektúrát használó modelleknek. Most pedig elkészült a Grok-3, és ez már a DeepSeekkel is felveszi a versenyt az előzetes eredmények szerint.

Galéria megnyitása

A bejelentés során kifejezetten nagy hangsúly helyeződött arra, hogy a Grok-3 tréningezése már az eddiginél tízszer nagyobb számítási kapacitást biztosító, Colossus szuperszámítógéppel történt. Ezzel korábban már többször foglalkoztunk, a cél az, hogy 1 millió GPU-t fogjanak munkára ebben a rendszerben. 200 ezer feldolgozó munkálkodott a Grok-3 modell tanításán. Azt is megtudtuk, hogy az első 100 ezer GPU telepítése és munkába állítása még 112 napot vett igénybe, a következő 100 ezer viszont már csak 92 napot, és a további bővítés pedig még gördülékenyebben mehet majd. Elvileg Nvidia H100 GPU-kat használ az xAI, de ezt most külön nem erősítette meg.

Galéria megnyitása

Válogatott mesterséges intelligencia tesztekben a Grok-3 képes lesz felülmúlni a GPT-4o, a Gemini 2 Pro, a DeepSeek-V3 és a Claude-3.5-Sonnet modelleket egyaránt. Sőt mi több, bizonyos feladványokat még a Grok-3 mini verziója is jobb eredménnyel fog abszolválni, mint a teljes értékű GPT-4o vagy más riválisok. A Grok-3 mini már egykisebb, rugalmasabban használható nyelvi modell, amit üzemeltetni is olcsóbban lehet. Egyelőre minden Grok-3 variáns előzetes eléréssel fut.

Galéria megnyitása

Követve a többi fejlesztőcsapat mintáját, munkáját, az xAI is előállt érvelő modellekkel. Ezek a korábbiaknál sokkal összetettebb válaszokat képesek adni, annak köszönhetően, hogy „jobban átgondolják” az eredményeket. Elsőként az OpenAI publikált érvelő modellt tavaly szeptemberre, de szép lassan minden vállalat elkezd ilyen elven üzemelő nyelvi modellekkel dolgozni. Ezek révén jobb minőségű válaszokat kaphatnak a felhasználók, de tovább is tart az eredmények megszületése. A matematikai feladványokban, programozásban, tudományokban lesznek a legjobbak a Grok érvelési modellek.

Galéria megnyitása

A Grok-3 Reasoning és a Grok-3 mini Reasoning egyaránt képes lehet legyűrni az o3-mini (high), a DeepSeek-R1 és a Gemini 2 Flash Thinking modelleket. Persze egyelőre csak a válogatott tesztek eredményeit ismerjük, később azért pontosabb és teljesebb képet kaphatunk a Grok-3 modellek performanszáról. A Grok mobilos appon keresztül lehet majd az érvelési modelleket élesben kipróbálni, az igazán nagy kihívást jelentő kérdésekre lesz „Big Brain” mód.

Galéria megnyitása

Több érvelési modell úgy lett elindítva, hogy lehet a rendszer „gondolatait” követni, ami sok érdekes információt világíthat meg. Viszont ez visszaélésekre is lehetőséget ad Musk szerint, éppen ezért a Grok-3 nem fogja mutatni a gondolatmeneteket. Szeretnék azt megelőzni, hogy „desztillációs” módszerrel mások nyerészkedjenek az xAI munkájából. A vádak szerint a DeepSeek így „okosodhatott” az OpenAI modelljeinek szintjére költséghatékonyan.

Újítása a Groknak, hogy kapni fog egy DeepSearch nevű funkciót, ami csak a nevében hasonlít az OpenAI Deep Research megoldására. Itt a DeepSearch arra szolgál, hogy a legfrissebb információkból, az internet valós idejű pásztázásából szerezze be a rendszer a válaszhoz szükséges adatokat. Ezáltal is pontosabb és aktuálisabb tájékoztatás tud majd adni a Grok a felhasználóinak – ilyen lehetőség is van már a riválisoknál.

Galéria megnyitása

A jövőben az X Premium+ előfizetés lehet majd elérni a Grok-3 nyelvi modelleket és korlátoltan a DeepSearch funkciót, de ez már havi 50 dollárba fog kerülni. Ezen felül jön egy új előfizetés is, a SuperGrok, ezzel plusz funkciókat és nagyobb szabadságot érhetnek majd el a felhasználok havi 30 dollárért cserébe. A SuperGrokkal jön képbe a garantált Grok-3 Reasoning modell és a jobb DeepSearch elérés is egyebek mellett, de ennek köszönhetően lesz kevésbé korlátolt a képgenerálás is. Idővel a Grok-3 is elérhető lesz ingyenesen elvileg, de most még nincs kész, és ameddig nem teljesen tekinthető késznek és stabilnak, addig a korai hozzáféréssel csak az előfizetők dolgoznak vele.

Az xAI dolgozik azon is, hogy legyen a Groknak audio-to-text funkciója, valamint hangos módja, ebben elmarad még a riválisok mögött, miközben igazából a képgenerálás sem teljesen házon belül van megoldva – van még hova fejlődnie a platformnak. Idővel a vállalati API révén is biztosított lesz majd a Grok-3 modellek alkalmazása. Ugyancsak a tervek között szerepel a nyílt forrású Grok-2 bevezetése is, erre a következő hónapokban kerülhet sor. Az újítások egy részét már a SuperGrok előfizetők fogják először megkapni a jövőben.

Elmondta az xAI, hogy a fejlesztéseik egyik sarokköve, hogy a különböző funkciók révén a Grok folyamatosan egyre jobb legyen az emberszerű interakciókban. Ez részben már azért is lehet fontos a cégnek, hogy esetlegesen a jövőben hatékonyabban legyen bevethető a Tesla által fejlesztett humanoid robotoknál. Afelől ugyanis semmi kétségünk nincs, hogy a háttérben a szálak összeérnek Elon Musk különböző projektjeinél.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére