Bejelentette a Google a Gemini nagy nyelvi modelljét, ami a vállalat eddigi legjelentősebb fejlesztése ezen a területen. A vállalat viszonylag váratlanul húzta elő a kalapból ezt az újítást, de azt látni kell, hogy a Gemini érkezését már korábban felvezette. Az LLM rendszerről egy külön hírben számoltunk be, ezúttal már arról lesz szó, hogy az okostelefonokon milyen változást hoz ez.
A Google rendkívül flexibilisre tervezte a Geminit, aminek három különböző paraméterkészlettel dolgozó verziója készült. A Gemini Ultra, a Gemini Pro és a Gemini Nano. A Gemini Ultra nagy adatközpontokba, vállalati célokra szolgál majd. A Gemini Pro különböző szolgáltatások hátterébe épül majd be (pl. Bard). A Gemini Nano pedig már olyan kicsi is kompakt lesz, hogy okostelefonokon is képes lesz elfutni, internetkapcsolat nélkül, helyben feldolgozva az adatokat.
Mivel egy kézben vannak a fejlesztések, a Google csapata hatékonyan tudott azon dolgozni, hogy a Gemini Nanót tényleg úgy méretezze, hogy az okostelefonokon is jól működjön. A cég több esetben is a Pixel 8 Pro szekerét igyekszik majd először megtolni, ami nem újdonság. Az utóbbi esetben azért egyre többször lehetett erre példát látni.
A Pixel 8 Pro mobilon izgalmas újításokat hoz a Gemini Nano nyelvi modell már mostantól kezdve. Két dolog rögtön az új nyelvi modellre váltva fog tovább üzemelni. Az egyik funkció a dedikált automatikus összefoglaló a hangrögzítő (Recorder) alkalmazásban, a másik pedig a Smart Reply intelligens válaszüzenet generáló opció a Gboard virtuális billentyűzetnél. Ezek korábban csak akkor működtek, ha a készülék interneteléréssel rendelkezett, és folyamatosan küldték az adatokat feldolgozásra, de ennek innentől vége. Mindkét funkció teljesen offline üzemre vált.
A Gemini Nano révén a felhasználók csak nyerni fognak. Annak köszönhetően, hogy helyben fut majd a feldolgozás, sokkal megbízhatóbbá válik a szolgáltatás. Ebből a szempontból eddig sem volt gond, biztonságosak voltak a funkciók, de mégis csak az a legjobb, ha nem kell adatokat küldeni a folyamatok során. Jobb eredményt tud majd nyújtani a Gemini Nano, mint az eddigi megoldás, és még gyorsabb is lesz így a rendszer. Sokkal gördülékenyebben fog menni például a válaszüzenetek létrehozása.
Egyelőre azért még vannak korlátjai az új nyelvi modellnek, de ezeket a keresőóriás fokozatosan ledönti majd. A Smart Reply funkció először a WhatsApp alkalmazásban fogja a Gemini Nano alapot kihasználni az üzenetek generálására. A továbbiakban pedig folyamatosan dolgozik majd a Google azon, hogy minél szélesebb legyen a támogatott alkalmazások listája. Azt is látni kell, hogy még csak angol nyelven „beszél” az LLM rendszer, de ez biztosan változni fog. Ezek miatt kezdetben a magyar felhasználók például ebből szinte semmit nem fognak észlelni, ha csak nem angol ismerőseikkel csevegnek.
A tervek szerint a Gemini Nano jövőre már a Google Assistant mögött is meg fog jelenni, és a Bard hangján szólal majd meg. A Bard be lesz vezetve a Google digitális asszisztens szolgáltatásába, és ezzel párhuzamosan pedig a kompakt nyelvi modell fogja a Bardot elsődlegesen helyben futtatni. Ezáltal a Gemini képes lesz egyre jelentősebb mértékben növelni a mesterséges intelligencia által feljavított felhasználói élményt.
„Egy Pixel okostelefon kicsi, elfér egy ember lábnyomában, ezért vannak memória és teljesítménykorlátjai, de mindezek ellenére egy hihetetlenül jó képességekkel rendelkező modell lesz a mobilokon a Gemini Nano” – emelte ki a Google szakembere. Azt is elmondták, hogy egyáltalán nem kell attól tartani, hogy a helyben futtatott nyelvi modell felzabálja a készülék erőforrásait, úgy lett kifejlesztve, hogy kiemelkedően hatékony legyen a CPU-, RAM- és tárhelyigény szempontjából egyaránt.
Az új LLM be lesz építve az Androidba, és széles körben támogatott lehet az új rendszereken. Bevezetésre kerül az operációs rendszerben az AICore komponens, ami arra szolgál majd, hogy a Gemini modellt a fejlesztők beintegrálhassák a saját alkalmazásaikba.
Egyelőre csak a Tensor G3 rendszerchippel fog menni a Gemini Nano, de ez jövőre meg fog változni. A tervek között szerepel a MediaTek, a Samsung és a Qualcomm kompatibilitás biztosítása egyaránt. Ezekkel a cégekkel már fel is vette a kapcsolatot a Google.
Az elmúlt években a Google nagyon sokat tett azért, hogy a Pixel mobilok a mesterséges intelligenciát a lehető legváltozatosabb módon tudják biztosítani. A cég a Tensor lapkákat már évek óta úgy fejleszti a Samsunggal közösen, hogy azok kiemelkedően hatékonyak legyenek a gépi tanulási feladatok gyorsításában, és ezzel együtt persze az MI alapú fejlesztésekben is. Ennek a munkának a gyümölcse kezd most egyre erőteljesebben beérni.