A Google, a Meta, az OpenAI és más nagy cégek mellett az xAI is szép lassan halad a saját fejlesztéseivel. Idén megjelent már a Grok-1.5 modell, valamint a vizuális lehetőségekre fókuszáló Grok-1.5 Vision is, most pedig egy újabb nagy frissítéshez érkeztünk. Itt a Grok-2, és rögtön két verzióban futott be, valamint egy képgeneráló funkció is érkezett.
A nyelvi modellek sokszor válnak elérhetővé több különböző méretben, ezúttal is ezt láthatjuk, ugyanis a Grok-2 mellett bemutatkozott a Grok-2 mini is. Ezek egyelőre még béta verzióban vannak, de már ki lehet őket próbálni. Az érdeklődők igény szerint bármelyik modellel beszélgetésbe elegyedhetnek.
„A Grok-2 egy szignifikáns előrelépés az előző generációs Grok-1.5 modellünkhöz képest, nagyszerű lehetőségekkel rendelkezik a csevegésben, programozásban, valamint az érvelés területén is. Az eddiginél sokkal intuitívabb működésre képes ez, könnyebb kezelni, és a sokoldalúságát tekintve is fejlődött.” – emelte ki az xAI.
Elmondta a vállalat, hogy a Grok-2 mini a Grok-2 kistestvéreként még mindig egy nagyon jól használható modell lesz. A fejlesztők ezeknél sokat dolgoztak azon, hogy a sebességben és a minőségben a megfelelő egyensúlyt megtalálják. Bizonyos tesztekben a Grok-2 jelenleg képes legyűrni a Claude 3.5 Sonnet és a GPT-4 Turbo modelleket az xAI elmondása alapján. A GPT-4o ellen is egész jól szerepel, de az OpenAI legfrissebb modelljével szemben azért már alulmarad, mint ahogy a Gemini 1.5 Pro is megelőzi az augusztusi kísérleti verziójában.
Az általános MI tesztekben elég jól szerepel a Grok-2, de még a Grok-2 mini is csak minimális lemaradásban van a testvére mögött. Több olyan terület is van, ahol az élvonalat képviseli, és a MathVista tesztben (matematikai érvelés vizuális alapon) például bejön az első helyre, megelőzve minden jelentősebb ellenfelét. A sokszor alkalmazott MMLU és HumanEval teszteken középszerű teljesítményt tud felmutatni, de a DocVQA-ban csak a Claude 3.5 Sonnet előzi meg, ez is egy olyan teszt, amiben a vizuális érzékelés fontos, a jelek szerint ez jól megy neki.
Ebből is látszik, hogy a Grok nyelvi már képes multimodális működésre, de a képek létrehozása még nem megy neki. A Grok chatbotnál az új képgenerálási lehetőséget egyelőre nem a saját eszközével oldja meg a platform. A hírek szerint a parancsok alapján képeket létrehozó funkció mögött a Flux.1 modell dolgozik, ami a Black Forest Labs fejlesztése, a csapat tagjai részben a Stable Diffusion szolgáltatáson dolgoztak korábban, így nagy tapasztalattal rendelkező, sokat látott szakemberekről van szó.
Mikor jön egy generatív MI eszköz, akkor az emberek általában azonnal elkezdik a korlátjait feszegetni. Nos, nincs ez másként a Grok chatbot képgeneráló megoldásánál sem, és a jelek szerint itt nem húztak meg túlságosan szigorú határokat. Az X-en már megjelentek a kokaint fogyasztó és fegyverekkel hadonászó amerikai ex-elnökök. A meztelenséget azért kerüli a szolgáltatás, mint ahogy a durva erőszakot is, de ezen túl azért meglehetősen laza erkölcsökkel rendelkezik.
Még azt is megoldja a képgeneráló, hogy az X felhasználók képeit feldolgozva, velük hozzon létre új anyagokat kérésre. A közösség biztosan jól fog szórakozni a Grok képgenerátorával, de azt nem tudjuk, hogy a hatóságok mit szólnak majd ehhez. Nem lenne meglepő, ha rövid időn belül visszafognák ezt a funkciót a fejlesztők, ahogy azt korábban már sok esetben láthattuk a generatív mesterséges intelligencia eszközök esetében.
A Grok chatbotot az X keretében lehet kipróbálni, és azonnali megosztási lehetőséget nyújt az X-re, ennek köszönhetően jelentek meg az által generált képek a mikroblogon nem sokkal a bejelentést követően. Az egyetlen gond az, hogy egyáltalán nem kínál ingyenes elérési, tesztelési lehetőséget, kizárólag az előfizetők számára nyújt hozzáférést a chatbothoz, és így a képgeneráláshoz is. Magyarországon az X Premium alaphangon havi 3175 forintba kerül.