A Gemini mellett a Google folyamatosan fejleszti a Gemma nyelvi modelleket is, melyek érdekessége abból ered, hogy “nyílt forráskódúak”, szabadabban lehet velük dolgozni a testreszabhatóság és az optimalizálás szempontjából. Az új Gemma 4 12B elfuthat helyben egy laptopon, miközben szinte úgy teljesít, mint a több mint kétszer nagyobb paraméterkészlettel dolgozó Gemma variáns.
A szerényebb környezetbe szánt Gemma E4B és a fejlett Mixture of Experts (MoE) architektúrás Gemma 4 26B közé szánt Gemma 4 12B a Google elmondása szerint erőteljes funkcionalitást biztosít jelentősen csökkentett memóriaigény mellett.
A Gemma 4 12B a Google első nyílt modellje közepes méretben natív audió feldolgozási képességgel.
Újszerű, egységes architektúrát alkalmazott a DeepMind fejlesztői gárdája a nyelvi modell létrehozása során, ami azt eredményezi, hogy itt nem multimodális kódolók dolgoznak azon, hogy a különböző formátumú tartalmak egységesen legyenek kezelve. Ebben az esetben a vizuális és az audió feldolgozás közvetlenül kapcsolódik az LLM eszköz gerincébe a beszámoló szerint.
Rendkívül fejlett érvelési képességekkel rendelkezik a Gemma 4 12B, szó szerint a sarkában jár a 26B paraméterkészlettel üzemelő korábbi Gemma 4 variánsnak. Sőt mi több, különleges helyzetekben akár még elé is keveredhet. A tervezők új megközelítése révén a modell rendkívül ütőképes a többlépcsős munkafolyamatok kezelésében, és éppen ezért az ágens feladatok kiszolgálásában is példásan teljesít.
Büszke arra a Google, hogy a kutatók és mérnökök képesek voltak azt elérni, hogy a Gemma 4 12B már akár helyben is alkalmazható legyen. Egy laptop elegendő neki a cég beszámolója szerint. Bár azért azt hozzá kell tenni, hogy a piac legerősebb laptopjaira kell itt gondolni, hiszen 16 GB-nyi VRAM (vagy egységesített memória) szükséges hozzá. Abból a szempontból is érdekes a modell, hogy MTP (Multi-Token Prediction) eljárást alkalmaz, ezáltal hatékonyabban és gyorsabban tud válaszolni.
A nagy népszerűségnek örvendő GPQA Diamond megmérettetés keretében Gemma 4 12B modellnek már 78,8 százalékos eredményt sikerült elérni, amivel nagyjából a Claude Sonnet 4.5 és a GPT-5.4 nano modellekkel hoz egy teljesítményszintet. Az MMMU Pro fejlett multimodális mesterséges intelligencia tesztben pedig 69,1%-ot produkált, ezzel pedig ugyancsak a Claude Sonnet 4.5 szintjét tudta hozni, a GPT-5.4 nanót (65%) pedig már magabiztosan megelőzte.
Elmondta a Google, hogy a fejlesztői csoportok nagy érdeklődésének köszönhetően a Gemma 4 modelleket már több mint 150 millió alkalommal töltötték le a megjelenésük óta. Változatosabb pedig nem is lehetne a felhasználási köre, hiszen építettek már ezt alkalmazva sérült emberek számára segítő robotkart, miközben alkalmazzák vállalati szintű MI biztonsági rendszerek alapjaként is.
A most rajthoz álló Gemma 4 12B révén még több helyen bukkanhat majd fel a modellcsalád. A Google várakozásai szerint az újdonságnak elsősorban az ágensi képességeit igyekeznek majd kihasználni a fejlesztők.