Egyetlen GPU-n gond nélkül elfut, mégis nagyon jól teljesít az új Google Gemma modell

EGYETLEN GPU-N GOND NÉLKÜL ELFUT, MÉGIS NAGYON JÓL TELJESÍT AZ ÚJ GOOGLE GEMMA MODELL

Megérkezett a Gemma harmadik generációja, ami az eddiginél is többet ígér, szinte minden szempontból fejlődést mutat.

Szécsi Dániel

A Google már hosszú ideje fejleszti a mesterséges intelligenciát, a nagy nyelvi modelleket és az egyéb hasonló eszközöket. A cégnek széles választéka van ezekből az eszközökből mostanra. Most éppen a Gemma modell lépet a következő szintre.

A Gemmát tavaly február végén jelentette be a Google. Ez egy olyan modell, ami többnyire nyílt, szabadon felhasználható, és nagyon „könnyed”, ennek köszönhetően szerény környezetben is futtatható. A Gemma kapcsán fontos, hogy a háttere ugyanaz, mint a Gemininek, azonos alapokon osztoznak, csak ez már nyílt és könnyen hozzáférhető, alkalmazható egyedi célokra. Tavaly június végén jelent meg a Gemma 2, ami azt ígérte, hogy akár más MI eszközökkel is gond nélkül integrálható, és az volt a mondás, hogy elég neki egyetlen Nvidia H100 Tensor Core GPU.

A korábbi fejlesztéseket továbbgondolva született meg a Gemma 3 modell, ami továbbra is a nyitottságot helyezi szem elé, és hozzáférhetőbbé teszi az MI alapú technológiák megalkotását. A Google úgy látja, hogy a fejlesztés sokakat érdekel, ezért mindenképpen érdemes belefektetni az energiát. Mostanra állítólag több mint 100 millió alkalommal töltötték le ezeket a modelleket, és állítólag már 60 ezer különböző Gemma variánst hoztak létre.

Gemmaverse néven indított a Google egy olyan közösségi teret, ahol az érdeklődők inspirálódhatnak, és a továbbiakban a fejlesztések már a Gemma 3 alapjára is épülhetnek.

Ez az első olyan Gemma modell a vállalattól, ami már a Gemini 2.0 modellek alapját veszi kölcsön. A megalkotása során pedig tartotta magát a csapat a korábbi elképzelésekhez. Kicsi, könnyen alkalmazható, mobilis megoldásról beszélhetünk, ami fürgén fut majd akár szerényebb hardveres környezetben is. Külön érdekessége a Gemma 3-nak, hogy minden eddiginél szélesebb kínálattal indul el, négy különböző méretben lehet vele dolgozni.

A Google 1 milliárd, 4 milliárd, 12 milliárd és 27 milliárd paraméteres Gemma 3 variánsokat kínál. Ezeket a cég már a korábbi tapasztalatokat felhasználva alkotta meg, és optimalizálta a visszajelzéseket is felhasználva.

Azt állítja a Google, hogy a mérései alapján a Gemma 3 páratlan teljesítményt nyújt a méretéhez képest. Állítólag képes lenyomni a Llama-405B modellt, a DeepSeek-V3-at, valamint az OpenAI o3-mini érvelési modelljét is. Persze azért vannak olyan modellek, amik képesek überelni az eredményeit, ilyen például a DeepSeek fejlettebb, R1 érvelő modellje. Kiválóan teljesít a LMArena teszten az MI eszköz, miközben elég a számára egyetlen Nvidia GPU vagy TPU elérése.

Több mint 35 nyelven használható tökéletesen a Gemma 3 azonnal, és a tréningezés révén előzetesen több mint 140 nyelvet ismer. Multimodális működésre képes a modell, videó is tud elemezni, ezáltal egyre többet hozhatnak majd ki belőle a fejlesztők. Érvelési képességgel is rendelkezik a Gemma 3, és 128 ezer tokenes kontextusablakot használ, ami az általános beszélgetések alkalmával bőségesen elegendő lehet. Persze a Geminitől bőven elmarad, ami nem meglepő, miután a Gemini piacvezető ezen a téren – már milliós kontextusablakokkal dolgozik.

Az érdeklődő fejlesztőknek a Google egy tartalmas dokumentumot tett elérhető, amiben 26 oldalon keresztül taglalják az új Gemma technikai hátterét. A Gemma 3 mellett pedig a cég még előállt a ShieldGemma 2 modellel, ami egy elég érdekes fejlesztés. Ez 4 milliárd paraméteres MI biztonsági ellenőrzőről van szó, ami a képek tartalmának elemzésére szolgál, és elvileg hatékonyabb a jelenleg képszűrőknél, így jobbnak bizonyulhat majd a sértő, veszélyes vizuális anyagok felderítésében.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

EGYETLEN GPU-N GOND NÉLKÜL ELFUT, MÉGIS NAGYON JÓL TELJESÍT AZ ÚJ GOOGLE GEMMA MODELL

TOP 5 AZ IPON-ON