Az Nvidia sok egyéb mellett egy rendkívül hasznos technológiát is bemutatott az elmúlt hét folyamán megrendezett GTC 2020 alkalmával, ez az újítás pedig nem más, mint az AI Video Compression. Az újfajta tömörítési eljárás segítségével a normál, H.264-es kodeket használó megoldáshoz képest jelentősen le lehet szorítani azt a sávszélesség-igényt, amit egy-egy videókonferencia kivitelezéséhez feltétlenül alkalmazni kell, azaz ha szélesebb körben is elterjed a technológia, óriási mennyiségű sávszélességet lehet megspórolni, amit más dolgokra fordíthatnak a felhasználók, illetve az internetszolgáltatók.
Az új tömörítési módszer alapját a mellékelt ábra próbálja szemléltetni, természetesen nagyon leegyszerűsített formában. A lényeg, hogy a videó kulcskockáiból egy algoritmus meghatározza a kulcspontokat, amelyek a fejmozgás, az arcmozgás, a szemmozgás, valamint az egyéb változások helyszínei tartalmazzák, majd a fogadó oldalon egy neurális hálózat (GAN Generative Adversarial Network) újra megalkotja a partner arcát a kapott változások figyelembevételével.
Ennek köszönhetően a képkockánkénti sávszélesség a H.264-nél érvényben lévő 97,28 KB-ról egészen 0,1165 KB-ra csökkenthető az AI segítségével, ami nem elhanyagolható előny, a képminőség pedig ezzel egy időben vállalható marad.
Az összehasonlítás kedvéért azt is megnézték, milyen lesz a képminőség, ha a H.264-es kodekkel tömörített videó esetében hasonlóan alacsony, egészen pontosan 0,1265 KB/képkocka sávszélességet alkalmaznak, a különbség pedig igen-igen látványos: a H.264-es kódolás meglehetősen pixeles, míg az AI által kezelésbe vett kép viszonylag jó minőséget kínál.
A fenti újítás akkor is alkalmazható, ha a partner maszkot, fejhallgatót, vagy egyéb kiegészítőt visel. Ez az újítás egyébként csak egy apró szelete az Nvidia Maxine platformjának, ami AI alapú valós zajszűrést, háttér-cserét, felbontás-felskálázást, valós idejű arc-animálást, illetve akár valós idejű tolmács funkciót is kínálhat.