Az xAI elképesztő sebességgel növekedik, mostanra olyan nagy lett, hogy még az X mikroblogot is beleolvasztották. Az értéke már a 100 milliárd dollárt is meghaladhatja, noha a felhasználói bázis méretét tekintve azért még elmarad a ChatGPT-től vagy akár a Geminitől, de a lehetőségek tárháza rohamtempóval bővül.
Bejelentette az xAI, hogy a Grok chatbot már képes lesz válaszolni olyan szöveges kérdésekre is, amikhez a kamerán keresztül látnia kell a környező világot.
A szolgáltatás a multimodális működés csúcsára ért, a fejlesztők megvalósították ugyanazt, amit korábban az OpenAI is elért a ChatGPT-vel, és a Google is összehozott a Gemini keretei között. Már nemcsak élő beszélgetésben lehet interakcióba lépni a generatív MI eszközzel a szöveges forma mellett, hanem gépi látást is kapott, a kamerán keresztül minden tud értelmezni, amit a felhasználó is lát önmaga körül.
A fejlesztők azt már korábban sikeresen megoldották, hogy a Groknak lehessen képi anyagokat is adni a szöveg és a hang mellett bemeneti információként. Ezt a lehetőséget emelték egy teljesen új szintre ahhoz, hogy a Grok Vision üzembe tudjon állni. Már meg is jelent több olyan videó, melyben élesben teljesít szolgálatot az új funkció, és egészen megbízhatóan teszi a dolgát, képeket és szövegeket egyaránt hatékonyan ismer fel. Képes így fordítani, dokumentumokból információkat kiemelni, termékeket felismerni.
Üröm az örömben, hogy az újítás kipróbálásához mindenképpen szükséges a SuperGrok előfizetés, és egyelőre még csak az iOS operációs rendszerű eszközökre szabott Grok alkalmazásban lehet elérni a Vision opciót. Az androidos eszközökkel rendelkezőknek erre az újításra még egy kicsit várniuk kell, de a fejlesztők már ennek a megvalósításán is dolgoznak. A SuperGrok előfizetés havi szinten 14 500 forintba kerül, egy évre pedig 146 ezer forintos áron lehet rendezni a költségét.
Ebby Amir, az xAI technikai csapatának tagja jelenthette be az X-en a Grok Vision névre keresztelt funkciót. A szűkszavú beszámolóból az is kiderült, hogy bővült a Grok nyelvtámogatása a hangalapú használat esetén, és már valós idejű keresések indítására is lehetőséget fog nyújtani a hangos használat mellett.
Eddig elsősorban angolul lehetett használni a hangalapú Grok Voice funkciót, de most már biztosan lehet hozzá szólni spanyolul, franciául, törökül, japánul és hindi nyelven is. Sajnos részletesebb listát nem kapunk arról, hogy néz ki jelenleg a nyelvtámogatás egészen pontosan. Nekünk értelemszerűen a magyar lenne érdekes, de az valószínűleg még nem biztosított, erre várnia kell az érdeklődőknek.
A hangos mód használata során indítható keresések révén a Grok bővebb információval tud majd szolgálni a felhasználóknak akár a legfrissebb eseményekkel kapcsolatosan is. Részleteket ugyan ennek kapcsán sem kaptunk, de korábban a Grok keretében az xAI szakemberei már megoldották a közvetlen internet elérési lehetőség biztosítását. Feltételezhetően ezt kapcsolták össze a színfalak mögött a Grok Voice funkcióval.
A Grok áprilisban kapta meg a fejlettebb memória funkciót is, hogy még hatékonyabb csevegőpartner válhasson belőle. És ugyancsak ebben a hónapban gyarapodott egy olyan felülettel is, ami segíti a dokumentumok, alkalmazások létrehozását, programkódok futtatását, hasonlóan a Claude-ban elérhető Artifacts szekcióhoz. A Grok Studio esetén pedig megvalósították a Google Drive integrációt a fejlesztők, így már gördülékenyen lehet az online tárhelyről fájlokat bevonni a munkába.