Shop menü

IZGALMAS TAGGAL BŐVÜL A GOOGLE GEMMA MODELLCSALÁDJA

Az új Gemma már az eddigieknél jobb lehetőségeket nyújt, ágens munkavégzésben kifejezetten erős, de továbbra is nagyon hatékony.
Szécsi Dániel (DemonDani)
Szécsi Dániel (DemonDani)
Izgalmas taggal bővül a Google Gemma modellcsaládja

A Gemini mellett a Google folyamatosan fejleszti a Gemma nyelvi modelleket is, melyek érdekessége abból ered, hogy “nyílt forráskódúak”, szabadabban lehet velük dolgozni a testreszabhatóság és az optimalizálás szempontjából. Az új Gemma 4 12B elfuthat helyben egy laptopon, miközben szinte úgy teljesít, mint a több mint kétszer nagyobb paraméterkészlettel dolgozó Gemma variáns.

A szerényebb környezetbe szánt Gemma E4B és a fejlett Mixture of Experts (MoE) architektúrás Gemma 4 26B közé szánt Gemma 4 12B a Google elmondása szerint erőteljes funkcionalitást biztosít jelentősen csökkentett memóriaigény mellett. 

A Gemma 4 12B a Google első nyílt modellje közepes méretben natív audió feldolgozási képességgel. 

Újszerű, egységes architektúrát alkalmazott a DeepMind fejlesztői gárdája a nyelvi modell létrehozása során, ami azt eredményezi, hogy itt nem multimodális kódolók dolgoznak azon, hogy a különböző formátumú tartalmak egységesen legyenek kezelve. Ebben az esetben a vizuális és az audió feldolgozás közvetlenül kapcsolódik az LLM eszköz gerincébe a beszámoló szerint.

Galéria megnyitása

Rendkívül fejlett érvelési képességekkel rendelkezik a Gemma 4 12B, szó szerint a sarkában jár a 26B paraméterkészlettel üzemelő korábbi Gemma 4 variánsnak. Sőt mi több, különleges helyzetekben akár még elé is keveredhet. A tervezők új megközelítése révén a modell rendkívül ütőképes a többlépcsős munkafolyamatok kezelésében, és éppen ezért az ágens feladatok kiszolgálásában is példásan teljesít.

Büszke arra a Google, hogy a kutatók és mérnökök képesek voltak azt elérni, hogy a Gemma 4 12B már akár helyben is alkalmazható legyen. Egy laptop elegendő neki a cég beszámolója szerint. Bár azért azt hozzá kell tenni, hogy a piac legerősebb laptopjaira kell itt gondolni, hiszen 16 GB-nyi VRAM (vagy egységesített memória) szükséges hozzá. Abból a szempontból is érdekes a modell, hogy MTP (Multi-Token Prediction) eljárást alkalmaz, ezáltal hatékonyabban és gyorsabban tud válaszolni.

A nagy népszerűségnek örvendő GPQA Diamond megmérettetés keretében Gemma 4 12B modellnek már 78,8 százalékos eredményt sikerült elérni, amivel nagyjából a Claude Sonnet 4.5 és a GPT-5.4 nano modellekkel hoz egy teljesítményszintet. Az MMMU Pro fejlett multimodális mesterséges intelligencia tesztben pedig 69,1%-ot produkált, ezzel pedig ugyancsak a Claude Sonnet 4.5 szintjét tudta hozni, a GPT-5.4 nanót (65%) pedig már magabiztosan megelőzte.

Galéria megnyitása

Elmondta a Google, hogy a fejlesztői csoportok nagy érdeklődésének köszönhetően a Gemma 4 modelleket már több mint 150 millió alkalommal töltötték le a megjelenésük óta. Változatosabb pedig nem is lehetne a felhasználási köre, hiszen építettek már ezt alkalmazva sérült emberek számára segítő robotkart, miközben alkalmazzák vállalati szintű MI biztonsági rendszerek alapjaként is. 

A most rajthoz álló Gemma 4 12B révén még több helyen bukkanhat majd fel a modellcsalád. A Google várakozásai szerint az újdonságnak elsősorban az ágensi képességeit igyekeznek majd kihasználni a fejlesztők.

Hírlevél feliratkozás
A feliratkozással elfogadom a Felhasználási feltételeket és az Adatvédelmi nyilatkozatot.

Neked ajánljuk

    Tesztek

      Kapcsolódó cikkek

      Vissza az oldal tetejére