A delfineket az eddigi kutatások alapján rendkívül intelligens állatokként tartjuk nyilván. A történelem során már szinte elképzelhetetlen mennyiségű kísérletet folytattak az delfinekkel, ezek között voltak egészen meredek próbálkozások is. Az 1960-as években még a NASA is beállt egy delfinekkel kapcsolatos kutatás mögé, de annak eredményét a történelem ma már valószínűleg szívesen elfelejtené. Azt a sztorit inkább nem részleteznénk, nézzük inkább, hogy a Google mivel próbálkozik most.
Az elmúlt évtizedekben nagyon sok izgalmas kutatás volt arra, hogy az emberek képesek legyenek megérteni a delfinek kommunikációját. Ezek az élőlények teljesen máshogy képezik a hangokat, mint ahogy az emberek vagy más szárazföldi állatok, másként működnek az érzékszerveik, de a tudomány folyamatosan dolgozik azon, hogy egyszer képesek lehessünk megfejteni a mondandójukat. A Wild Dolphin Project az egyik olyan nagy kutatás, ami részben erre irányul, és ehhez csatlakozott most a Google.
A Georgiai Egyetem kutatói, a Wild Dolphin Project szakemberei és a Google tudósai összefogásban próbálják létrehozni azt a nyelvi modellt, ami mér a delfinek kommunikációjának dekódolására irányul. Az eszköz alapját a Gemma ingyenesen elérhető nyelvi modellje biztosítja, és éppen ezért kapta a fejlesztése a DolphinGemma nevet. A nyelvi modellt ebben az esetben a Wild Dolphin Project keretében több évtized alatt összegyűjtött adatokkal képezik.
A cél nemcsak az, hogy képesek legyünk megérteni, hogy a delfinek az általuk kiadott hangokkal mit szeretnének elmondani, hanem az is, hogy a jövőben akár válaszolni is képesek legyünk nekik. A mesterséges intelligenciában és a nyelvi modellekben benne van annak a lehetősége, hogy az emberiség kapcsolatot tudjon teremteni a tengerek, óceánok lakóival.
A delfineket kutatók már hosszú ideje dolgoznak olyan eszközökkel, mint a gépi tanulás, és ezek már sokat segítettek a munkájukban, de az igazi áttörést a most kibontakozó mesterséges intelligencia forradalom hozhatja majd meg. A DolphinGemma megalkotásához a Google egy saját fejlesztésű audio technológiáját használta, a SoundStream hatékonyan tokenizálja a delfinek hangját, és ezzel képes a modell dolgozni.
A DolphinGemma elsődleges célja, hogy felismerje a mintázatokat, struktúrákat, és végül képes legyen megjósolni azt, hogy egy-egy mintát milyen további információk követnek. A nagy nyelvi modellek így tudják a mondatokat megalkotni, és így lehetne a DolphinGemma használatával minden eddiginél közvetlenebb kapcsolatot teremteni az állatokkal. A nyelvi modell kellően kicsi és kompakt lett ahhoz, hogy egy okostelefonon is tudjon üzemelni. Pixel mobilokat használva létrehozták a CHAT (Cetacean Hearing Augmentation Telemetry) rendszert, amit már a víz alatt hordozva lehet használni a hangok elemzésére.
Az első CHAT rendszert még Pixel 6 okostelefonnal alkották meg a kutatók, és már ez képes volt a víz alatt elemezni a delfinek hangját. Azonban már készül az új generációs eszköz, melynél a Google Pixel 9 fog munkába állni, jóval nagyobb számítási kapacitással. A Pixel 9-cel már élesben lehet mélytanulási eszközöket futtatni és mintafelismerő algoritmusokat használni, akár egymással párhuzamosan is.
A DolphinGemma projekt egyelőre szép reményeket ébreszt a szakemberekben, a Google már arról beszél, hogy szélesebb közönség bevonásával folytathatják a munkát, és megosztanák ezt az eszközt másokkal is. A tervek szerint finomhangolnák idővel, és ehhez változatos delfinfajok hanganyagait használnák.