Több mint egy évtizede már annak, hogy a Google lehetőséget nyújt a felhasználóknak arra, hogy képek alapján indítsanak kereséseket. A Google Lens már egy továbbfejlesztett verziója az eredeti képkereső technológiáknak, de már a Lens is túl van a hetedik születésnapján. A cégnek óriási tapasztalata van ezen a téren, és most új távlatokat nyit a felhasználók előtt.
A Google bejelentette, hogy már nemcsak képekkel, hanem videókkal is boldogulni fog a Lens szolgálatás, ami korábban már közvetlenül a Google Keresőbe is integrálva lett.
Napjainkra a Google Lens egy kiválóan használható eszköz lett, a szimpla képkeresésen felül magától felismeri a QR kódokat is, nem kell már külön erre egy alkalmazást tartani, de segít megoldani a házi feladatokat is, ha éppen arról lenne szó. Matematikai képleteket fejt meg képekről, és kérdésekre is válaszol.
Képekkel nagyon sok dolgot lehet megmutatni a Kereső rendszerének, de megesik, hogy egy fotó nem mutatja be pontosan azt, amire a felhasználó a választ keresné, egy videóval viszont már tökéletesen bemutatható a téma. A Google Lens a továbbiakban már ilyen esetben is segítségül hívható majd. A világon elsőként lehetőséget biztosít majd a szolgáltatás arra, hogy videókkal indítsanak kereséseket a felhasználók. Egy videóban lehet, hogy már nem olyan egyértelmű, mit szeretne kideríteni az ember, mint egy fotónál, azért lehet mankót is adni a keresésekhez.
A felhasználó a feltöltött videó mellé a keresőmezőben begépelheti, hogy pontosan mire lenne kíváncsi. De igazság szerint itt már nem is kell ilyennel időt tölteni. Egész egyszerűen a videó alatt elmondhatja a felhasználó, hogy mit akar megtudni, a Google Lens külön feldolgozza a hangsávot is, és már azonnal a kívánt találatokat hozhatja majd.
A Google felvázolása alapján az AI Overview felületet használva fognak már itt az eredmények megjelenni, ami azt jelenti, hogy a videók feldolgozását részben a mesterséges intelligenciára bízza a vállalat.
Egyelőre a Search Labs keretében lehet kipróbálni a videós Google Lens funkciót, még nincs szó arról, hogy szélesebb körben elérhetővé válna. A szolgáltatás tesztelése indult el felhasználók bevonásával. Ez eltarthat majd egy ideig, de legalább a platformok között nem tesz különbséget a cég. Az Android és az iOS rendszerű okostelefonokra, táblagépekre egyaránt biztosított a videós keresési funkció.
Folyamatosan dolgozik azon a Google, hogy a Gemini MI rendszerét minél több helyen alkalmazza, így nem meglepő, hogy már a Google Lens szolgáltatást is elérte ez. Azonban azt hozzá kell tenni, hogy éppen emiatt a válaszok hitelességét ugyanolyan fenntartásokkal kell kezelni, mint a mesterséges intelligencia kereséseknél kapott válaszokat úgy általában. Szóval a válaszokban benne van annak a lehetősége, hogy hallucinál a rendszer.
Rajan Patel az új funkció technikai hátteréről azt nyilatkozta, hogy a képek feldolgozása ugyanúgy megy mint eddig, képkockánként, csak a rendszer már azt is alapul tudja venni, hogy mi történik az egymást követő képeken, és ehhez már a Gemini modellt veti be a szolgáltatás. Elvileg a cég külön készített egy egyedi Gemini modellt ehhez a feladathoz. A Google lehetővé teszi hamarosan azt is, hogy a megszokott képkeresések mellett lehessen hangos kérdéseket, utasításokat adni a Keresőnek.
A hangot csak a felhasználók kérdésre vonatkozóan használja fel egyelőre a Google Lens, a környezeti zajokat nem kezeli még együtt a képpel a találatok tovább pontosításáért. Ez a videókra és a hangalapú keresésre egyaránt érvényes. Ugyanakkor már dolgoznak azon is a cég, hogy a hangokat is képes legyen keresni. A jövőben a Google Lens alkalmas lehet majd arra, hogy egy levideózott madarat hatékonyabban ismerjen fel a hangját is azonosítva a képek feldolgozásával párhuzamosan.
Ennek a funkciónak már csak egy nagy hátránya lesz: a hatalmas számítási kapacitás igény. Napjainkban minden fronton arról beszélnek, hogyan lehet a környezetvédelmet elősegíteni. Nos, egy dolog biztos. Nem azzal, hogy már videókkal fogják bombázni a felhasználók a Google rendszerét egyszerű képi keresések miatt. Az adatforgalom is eléggé megnőhet, de az csak egy dolog, a hátterében ott van még az is, hogy a Google nyelvi modelljei fogják a tartalmakat feldolgozni, és azt már mondanunk sem kell, hogy jelenleg a generatív MI szolgáltatások óriási energiaszükségletekkel üzemelnek.
Nem véletlen az, hogy már a Google is abban gondolkodik, hogy atomerőművekkel oldaná meg a különböző adatközpontjainak kiszolgálását. Az ilyen egyszerűen használható, felhasználók millióinak szánt ügyes funkciók, mint a Google Lens videós keresése, igencsak energiaéhesnek ígérkeznek az eddigi Lens funkciókhoz képest.