A DeepSeek 2023-ban kezdte meg a működését, és már az legelején nagy hangsúlyt kezdtek arra helyezni, hogy kiemelkedő hatékonyságra legyen képes a nyelvi modellje. Ennek köszönhetően tudta az egész nyugati világot meglepni a chatbotjával. A szolgáltatást akkora érdeklődést kezdte övezni, hogy korlátozni kellett a regisztrációs lehetőséget, állítólag kibertámadás is érte a szolgáltatást, de ezt független forrás nem erősítette meg.
„A DeepSeek felbukkanását egy figyelmeztető jelzésnek kell vennie az amerikai technológiai cégeknek” – jelentette ki Donald Trump.
Kiválóan érzékelteti a DeepSeek berobbanásának jelentőségét, hogy még a frissen beiktatott elnök is megszólalt az ügyben. A DeepSeek R1 alapú chatbot éppen akkor indult el, mikor Trump átvette az elnökséget, január 20-án vált elérhetővé a szolgáltatás, és kevesebb mint egy hét alatt sokak érdeklődését keltette fel. Mostanra az App Store letöltési listáján átvette az első helyet, lekörözve egyebek mellett a ChatGPT-t is.
Trump a beiktatását követően nem sokkal, bejelentette az Egyesült Államok történetének legnagyobb mesterséges intelligencia infrastruktúra fejlesztését. A Stargate projektben összesen 500 milliárd dollárt szeretnének a következő 4 évben adatközpontokat és egyéb területeket érintő fejlesztésekbe fektetni a legnagyobb technológiai cégek a kormányzat támogatásával együtt.
Az elnök úgy látja a friss helyzet alapján, hogy az amerikai techcégek hajlamosak lehetettek elkényelmesedni az utóbbi időben. Ezért akár még hasznos is lehet a DeepSeek megérkezése, hiszen ezáltal az ágazat szereplői felismerhetik, hogy „lézer fókuszáltan kell a versenyre koncentrálniuk”. Úgy véli, hogy az olcsó modell megjelenését „rendkívül pozitív fejleményként kell értékelni” a mesterséges intelligencia fronton. Így már tudjuk, hogy „milliárdok és milliárdok elktöltése helyett, remélhetőleg kevesebb költéssel is elő lehet állni ugyanolyan megoldásokkal”.
Trump beszélt arról is, hogy a DeepSeek erőteljesen cenzúrázza a kínai történelmet, ami szerinte arra utal, hogy a kormány kontrollálja a platform működését. Az Egyesült Államok pedig nem látja szívesen a kínai nyelvi modelleket. Ezek ugyanis kockára tehetik a nemzetbiztonságot. Az amerikai kormányzat el is kezdte tiltani a DeepSeek chatbotját a különböző területeken, így például a haditengerészet dolgozói már nem használhatják.
Az Nvidia hatalmasat esett a DeepSeek sikerének hírére, és mivel Jensen Huang vagyonát többnyire az Nvidia részesedése adja, így maga is nagyot bukott ezen. Nagyjából 20 milliárd dollárral csökkent a vagyona, ami új rekord, soha senki nem veszített még el ennyi pénzt egyetlen nap alatt az USA-ban. Éves szinten a toplistát Elon Musk vezeti 182 milliárd dollárral, ezt legalább biztosan nem fogja megdönteni, mert „csak” 101 milliárd dolláros vagyona maradt a mostani zuhanást követően. A kezdeti sokk után egyébként is elindult az árfolyamok emelkedése, szóval egyelőre nem olyan nagy a baj.
Huang kiemelte a DeepSeek kapcsán, hogy egy „nagyszerű előrelépést jelent az MI területen”. Az Nvidia szóvivője hozzátette, hogy az új startup munkája kiválóan illusztrálja, miként lehet új modelleket alkotni a legújabb technikák alkalmazásával. Különösen büszke arra az Nvidia, hogy a cég által novemberben és a CES során is kiemelt Test-time Scaling eljárás is hozzájárult a DeepSeek sikeréhez azon túl, hogy a MoE (Mixture of experts) technikát is beveti. Ezeket egyébként már az OpenAI is alkalmazza a legújabb fejlesztéseinél.
Az OpenAI-t sokan az MI frontvonal etalonjának tartják, de a DeepSeek kapcsán Sam Altman is rendkívül elismerően nyilatkozott. „A DeepSeek R1 egy lenyűgöző modell, különösen ami azt illeti, hogy mit tudnak nyújtani egy adott összegért cserébe” – emelte ki Altman. Miközben azért azt is hozzátette, hogy a hatalmas számítási kapacitások felhalmozása most fontosabb, mint valaha. Igyekezett az OpenAI eddigi lépéseit megvédeni a vezető, és megerősítette a kétkedőket abban, hogy továbbra is úgy látják, hogy van értelme a sok milliárdos beruházásoknak.
A DeepSeek a riválisaihoz hasonlóan, több méretben kínálja a modelljét, lehet ezt futtatni akár lokálisan is. Továbbá rendelkezik olyan modellel is, ami képi tartalmakra szakosodott, ez a Janus-Pro névre hallgat. Ez is nagyon bíztató eredményeket tud felmutatni, azonban egyelőre csak 384 x 384 képeket lehet vele létrehozni. Innentől még rengeteg fejlesztési lehetőség van, és valószínűleg sokat fogunk még hallani a startupról a jövőben.