A Google, az OpenAI, a Meta és az Anthropic már szinte hónapról hónapra egymásra licitálva hozza ki a jobbnál jobb képességű MI eszközöket. A Meta továbbra is nyílt forrású megoldásokban gondolkodik, és áprilisban már elhintette, hogy „egy olyan nyílt modellel készülünk, ami a teljesítményt tekintve harcban lesz a legjobb privát modellekkel, olyan cégektől, mint például az OpenAI”.
Most ez a modell megérkezett, a Llama 3.1 a vállalat eddigi legjobb és legnagyobb nyílt forrású MI modellje, és ez már elvileg bizonyos tesztekben lekörözi a GPT-4o és a Claude 3.5 Sonnet modelleket is. A vállalat szerint a Meta AI már jobb beszélgető partnernek bizonyulhat majd, mint a ChatGPT. Egyre több nyelven lehet használni szélesebb régitámogatás mellett, és már a képgenerálási lehetőséget is biztosítani fogja. Azonban nekünk azt is hozzá kell tennünk, hogy az EU-ban egyelőre nem elérhető a Meta AI, és megtippelni is nehéz, hogy ez mikor változhat meg.
Mark Zuckerberg arról beszélt a bejelentésben, hogy az év végére a Meta saját chatbotja lesz a legnagyobb felhasználói bázissal rendelkező ilyen szolgáltatás, tehát rövid időn belül megelőznék a ChatGPT-t is. A Llama 3.1 annak köszönhetően jelent nagy előrelépést az áprilisban bejelentett Llama 3-hoz képest, hogy szó szerint hatalmasra nőtt, 405 milliárd paramétert használ, és 16 ezer Nvidia H100 GPU-t használtak a tréningezéséhez.
A Meta úgy látja, hogy a nyílt modelleké a jövő, ezek fogják dominálni a piacot a jövőben, és a Llama az első, aminek sikerül felülkerekednie a privát fejlesztéseken.
„Hiszek abban, hogy a Llama 3.1 megjelenése egy fordulópont, innentől a piaci szereplők már nagyobb részben fognak nyílt modellekkel dolgozni” – jelentette ki Mark Zuckerberg. Az újdonság üzemeltetése ráadásul sokkal olcsóbb, mint amennyibe a GPT-4o kerül, nagyjából fele annyiból megúszható 1 millió token feldolgozása.
Lehetőséget nyújt a Meta arra, hogy a partnerek a saját adataikon tréningezzék a Llama 3.1-et, így specifikus MI eszközöket hozhatnak majd létre különböző feladatokra, nagyobb biztonságot, megbízhatóságot elérve. Azt is örömmel emelte ki a vállalat, hogy az ágazatban az egyik legszélesebb partnerkapcsolati hálót képes felmutatni. Az Amazon, a Databricks, az Nvidia, a Google, a Microsoft és mások mellett a Dell, valamint az IBM is beállt mögé. A legtöbb lehetőséget a Databricksen keresztül képes biztosítani a vállalat.
A sokszor kiemelten kezel MMLU tesztet a Llama 3.1 egy hajszállal a GPT-4o mögött zárta, 88,6 százalékot ért el a 88,7% ellenében, a Claude 3.5 Sonnet pedig 88,3 százalékot hozott össze. Az ugyancsak népszerű GSM8K megmérettetést már a Llama 3.1 zárta az élen, de ez is nagyon szoros volt a különböző nyelvi modellek esetén. A programozási problémákkal mérő HumanEval keretében már kicsit nagyobb a hátránya a többiekhez képest, ilyen téren még van hova fejlődnie, de a hosszú kontextuskövetési képességeket mérő tesztekben már a Llama szerepel a legjobban.
A 405 milliárd paraméteres Llama 3.1 mellett készülnek kisebb változatok is. Érkezik a 70 milliárd paraméteres és a mindössze 8 milliárd paraméteres kivitel is. Ezek még olcsóbbak, hatékonyabbak lesznek, és a 8 milliárd paraméteres Llama 3.1 akár már mobileszközökön, notebookokon is futhat helyben.
A Meta AI használata során, mikor a felhasználó kifut a heti limitből, akkor a 405 milliárd paraméteres Llama 3.1 modellről át fog váltani a 70 milliárd paraméteresre a rendszer. Ebből azért azt lehet érzékelni, hogy hiába olcsóbb, mint a GPT-4o, azért a Meta számára megterhelő lenne végtelenül biztosítani minden felhasználónak. A Llama 3.1 70B már lényegesen alacsonyabb ár mellett üzemelhet 1 millió token feldolgozására levetítve.
Érdekes újítása még az „Imagine Me” funkció a Meta AI-nak, mely egy olyan képgeneráló, ami felhasználja az emberek arcát, és ez alapján készít róluk képzeletbeli képeket. Ebben az esetben már többről van szó egyszerű képgenerálásnál, a mobiltelefonnal be kell az embereknek szkennelniük az arcukat, ha ezt a fejlesztést szeretnék használni. Azért nem a felhasználók által feltöltött képeket használja, hogy ne lehessen deep fake visszaélésekre használni.
A Meta által felvonultatott Llama 3.1 harmadik féltől származó fejlesztésekben is feltűnhet majd a továbbiakban. Ez az eszközön futó MI szempontjából is érdekes lehet majd, hiszen a Llama 3.1 8B már több mobilos applikációba is beépülhet.