A mesterséges intelligencia versenyben a Google az idei évre nagyon erős pozíciót fogott, és szünet nélkül keresi azokat a lehetőségeket, amikkel a saját ökoszisztémájából a lehető legtöbbet tudja kihozni. Ennek az egyik fontos eleme a Personal Intelligence, és most a Gemini a képgenerálás frontján kapott olyan újítást, ami erre támaszkodik.
A Personal Intelligence keretében a Google igyekszik az egyéb szolgáltatásait becsatornázni a Geminibe. Ennek az a lényege, hogy a felhasználó “globális” Google-fiókjához kapcsolódó sokszínű adatokat igyekszik a rendszer feldolgozni a különböző területeken a jobb válaszokhoz. Hiszen minél több információból tud dolgozni az MI, annál jobb minőségű és pontosabb eredménnyel képes szolgálni. A személyes információk révén pedig az emberek még inkább azt érezhetik, hogy a Google MI funkció a kezük alá dolgoznak.
A továbbiakban a Geminiben a Nano Banana 2 modell jobb képeket hozhat majd létre, mivel a Personal Intelligence révén hozzáférés adható majd neki a Google Fotókhoz.
A Gemini a Nano Banana révén talán a legjobb mesterséges intelligencia képek létrehozásához, és a jövőben már egyenesen olyan élmény lehet majd ezzel dolgozni, mintha az ember gondolataiban olvasna. Pedig “csak” a legszemélyesebb felhasználói adatait kutatja fel és elemzi a háttérben. Már 1-2 mondatos egyszerű prompttal is olyan képeket hozhat létre a Gemini, amik azonnal elnyerik a felhasználók tetszését, mert elég adatot tud meríteni ehhez a színfalak mögül.
A Google Fotók keretei között tárolt képekből nyert információk révén a Gemini sokkal többet tudhat meg, mint ahogy azt elsőre gondolná az ember. Az felhasználók fotói már a legszemélyesebb adatok közé tartoznak, ezért veszélyesnek hangozhat ehhez hozzáférést adni, ugyanakkor a használati élményt jelentősen fokozhatja a Personal Intelligence.
Elég lesz annyit mondani a Gemininek, hogy hozzon létre egy családi képet gyurmából kialakított művészeti alkotásként. A mesterséges intelligencia ezt követően elemzi a felhasználó képeit, beazonosítja a családtagokat a fotókon, elsősorban a családi képeket keresve fog támpont után kutatni. Ha megfelelő mennyiségű adatot begyűjtött, akkor nekiáll a generálásnak, és a kész kép jó eséllyel közel olyan lesz, mint amit a felhasználó látni szeretett volna. Miközben ehhez még külön képet sem kellett feltölteni a Gemini számára kiindulási alapként.
Kiemelte a Google, hogy a Personal Intelligence által biztosított információkat soha nem használja fel tréninghez, itt sincs ez másként. A Google Fotók könyvtárakban található képeket a Gemini kizárólag átmenetileg veszi igénybe bevitt információként, azok tartalmát pedig a hozzájuk kötött címkék alapján futja át, nem elemez mindent mélyebben.
Azt viszont hozzá kell tenni, hogy a generálásokból származóan “korlátozott mennyiségű” információt mégis igénybe vesz a Google, és a Gemini által létrehozott képeket, azok kapcsán a visszajelzéseket már felhasználhatja a tréninghez. Ez viszont már eddig is így volt. A Personal Intelligence opcionális funkció, külön kell engedélyezni, és első körben csak az USA-ban lesz elérhető a mostani újítás az előfizetők számára.