A mesterséges intelligencia fejlesztések minden nappal új mérföldkőhöz érkeznek. Rengeteg tudós és mérnök dolgozik azon, hogy ezek az algoritmusok kényelmesebbé, jobbá és praktikusabbá tegyék az életünket. A gépi látás pedig úgy tűnik, hogy új fejezethez érkezett, ugyanis a Google új MI-je már lát a sötétben, ráadásul ehhez elég bármilyen olyan fényképezőgép vagy telefon felvétele, ami képes RAW-ban fotózni.
Dr. Zsolnai-Fehér Károly Two Minute Papers YouTube csatornáját nagyjából a világ összes AI kutatója figyelemmel kiséri, hiszen hétről-hétre bemutatja azt, hogy hol tartanak ezen a dinamikusan fejlődő iparág fejlesztései. Most egy olyan videót tett közzé, ami még az ő elképzelését is felülmúlta a képjavítás terén, hiszen szinte lehetetlen feladatnak tűnik teljesen sötét képekből információt nyerni egy ember által is élvezhető fényképhez, de egy új MI-nek már ez sem jelent problémát.
A videó elején megtekinthetünk egy olyan algoritmust, ami képes több fotóból egy folyamatos videót csinálni. Ez magában is lenyűgöző, de ami igazán agyeldobóssá teszi a rendszert, hogy ugyanezt a technikát a sötétben látáshoz is lehet használni.
A fényképezőgépek RAW szenzor adatai sokkal több információt tárolnak el egy fényképen, mint például egy .jpg formátumú, tömörített kép. Ha megnézzük a RAW képeket, akkor viszont látni fogjuk, hogy azok túl zajosak, zajszűrő technológia nélkül nem lehet hasznosítani a képet, a szűrés viszont mindig információvesztéssel jár.
Bár vannak jobb minőségű, akár AI-ra épülő zajszűrő algoritmusok, ezek még mindig nem elég jók, hogy a sötétben lássunk velük. A NeRF fejlesztése viszont lehetővé teszi, hogy ha van több sötétben készült fotónk, akkor legyen szinte bármennyire is sötét, a legminimálisabb fényforrás mellett is tökéletesen világos, tiszta és látható képet fogunk kapni.
A RAWNeRF viszont ennél többre is képes. A segítségével több szögből megtekinthetjük a megörökített jelenetet, sőt, mi választhatjuk azt ki, hol legyen a képen a fókuszpont, mindezt pedig valós időben. A módszer annyira jól működik, hogy még a korábban láthatatlan feliratokat is láthatóvá teszi. A beágyazott videókban látható működésben a NeRF, ahogy azt is megtekinthetjük, hogy 2 év alatt mennyit fejlődött a technológia, korábban ugyanis közel se működött ennyire elképesztően hatékonyan.
A NeRF in the Dark: kutatás elérhető ezen a linken, ahonnan egyenes úton eljuthatsz a GitHub oldalra is. Egy ilyen rendszer működőképessé tétele tréningezéssel egy professzionális AI kutatónak is kihívás lehet, de ha van időd és energiád, akkor te magad is összeállíthatod a rendszert, hogy kipróbáld és használd a kutatást.
Innen már tényleg nem lehetünk olyan messze, hogy a CSI helyszínelők sorozat mintájára térben is bejárható, végtelenségig nagyítható képeket készítsen mondjuk egy térfigyelő kamera hálózat. Talán újabb két év, és már ilyeneket is fogunk látni.