Meglehetősen sokat ígér a Musk-féle nagy nyelvi modell

MEGLEHETŐSEN SOKAT ÍGÉR A MUSK-FÉLE NAGY NYELVI MODELL

Az xAI által fejlesztett rendszer a Grok chatbot révén villanthatja majd meg a tudását elsőként, de ez integráltan része lehet még a Tesla villanyautóknak is.

Szécsi Dániel (DemonDani)

A Bing, a Bard és a ChatGPT elvileg egy egészen komoly riválist kaphat majd Elon Musk mesterséges intelligenciával foglalkozó vállalata, az xAI fejlesztése révén Grok néven. Ahogy azt a chatbotról szóló tegnapi hírben megírtuk, a szolgáltatás mögött a Grok-1 nagy nyelvi modell fog állni, amiről egyre többet lehet tudni.

Elon Musk több szálon kötődik a mostani MI „forradalomhoz”, hiszen korábban létrehozta az xAI-t, de a Teslánál is hosszú ideje foglalkozik mesterséges intelligenciával, sőt mi több, valójában a ChatGPT-t megalkotó OpenAI szervezetnek is a részese volt éveken keresztül, az alapítástól kezdve. Az üzletember a ChatGPT indulását követően nagyon sokat kritizálta a rendszert, és akkor elhatározta, hogy saját megoldást hoz kalap alá.

A fejlesztők meglehetősen intenzív munkával hozták létre a Grok nagy nyelvi modellt. Ahogy azt korábban elmondtuk, az xAI néhány hónap alatt alkotta meg a chatbot alapjául szolgáló LLM rendszert, és a tanítási folyamata csak 2 hónapja tart. Az első komolyabb prototípus a Grok-0 néven futott, és az már rögtön egy 33 milliárd paraméterrel dolgozó nagy nyelvi modell lett. De az xAI elmondása szerint már azzal sikerült a nyelvi modelleknek készült teszteken megközelíteni a Meta Llama 2 (70B) megoldását.

A Grok-1 rengeteg tréninget és különböző célirányos fejlesztéseket követően hatalmas fejlődést ért el például a programozás és az érvelés terén. A HumanEval tesztben, ami Python kódkiegészítő feladatokat és más programozással kapcsolatos feladványokat vonultat fel, a Grok-1 modell messzemenően jobban teljesít, mint az Llama 2 vagy akár a GPT-3.5, a 63,2%-os eredményét csak a GPT-4 és a Claude 2 modell tudja überelni 67, illetve 70%-kal.

Az xAI pontosan tisztában van azzal, hogy még nagyon sok munka vár rá, de már azonosították, hogy mely területeken kell elsődlegesen csiszolni a Grok-1 működésén. Azért is próbálgatják a nagy nyelvi modellt a különböző teszteken, hogy lássák, mit mutat a konkurens megoldásokhoz képest.

Jelen állás szerint a Grok-1 a Palm 2, a Claude 2 és a GPT-4 mögött van a rangsorban a képességeit, teljesítményét tekintve. De már magabiztosan megelőzi a GPT-3.5 modellt, valamint az Llama 2-t is, és sok esetben jobbnak bizonyul az Inflection-1-nél is. A kezdeti Grok-0-hoz képest pedig hatalmas előrelépést mutat, ami azért fontos, mert mindössze néhány hónapnyi munka van a kezdeti és az aktuális LLM között.

Azt nem árulta el az xAI egyelőre, hogy a Grok-1 hány milliárd paraméterrel dolgozik, csak azt lehet tudni, hogy a Grok-0 esetén 33 milliárd volt az a szám. A maximális kontextushossza 8192 token, mint az alap GPT-4-nek, bár annak azért vannak kiterjesztett változatai is ebből a szempontból. A Grok-1 most még nem tud teljesen függetlenül az interneten adatokat keresni, és az xAI kiemelte, hogy az általa nyújtott információk valódiságáról meg kell győződni, mert előfordulhat, hogy „hallucinál”.

A betanításához az internetről gyűjtött adatokat használtak, és ez a kollekció egészen friss, az idei harmadik negyedévvel bezárólag széles tudással rendelkezik, és a tréningezése során az AI Tutors is adatokat biztosított a fejlesztők számára. A fejlesztők folyamatosan dolgoznak majd azon, hogy a nyelvi modell a következő szintre léphessen, ezzel párhuzamosan pedig már a felhasználási lehetőségeket is biztosítják.

A Grok számos ponton kapcsolódni fog az X közösségi platformhoz, és akár annak keretében is elérhetővé válhat majd; információkat pedig biztosan képes lesz a mikroblogról szerezni. Továbbá az előfizetést tekintve is összekapcsolódhat a két teljesen különböző szolgáltatás. Emellett pedig a Tesla személyautókba is beülhet állandó utastársként a Grok, ezt már tesztelik is.

Egy bétateszter elárulta, hogy a Grok mesterséges intelligenciának egy különálló variánsa natívan fog futni a villanyautókban, kihasználva a helyben rendelkezésre álló számítási kapacitást. Ez alapján a Grok több méretben is elérhető lehet, ahogy azt korábban más fejlesztéseknél is láthattuk, a Llama 2-nek például már van mobilon is bevethető verziója. A Tesla ezzel a fejlesztéssel a jövőben új szintre emelheti az autók és az emberek közötti kapcsolatot.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

MEGLEHETŐSEN SOKAT ÍGÉR A MUSK-FÉLE NAGY NYELVI MODELL

TOP 5 AZ IPON-ON