Az idei év elején igencsak megrázta a mesterséges intelligencia piacot, mikor a DeepSeek berobbant egy olyan MI eszközzel, ami szinte minden szempontból jobbnak bizonyult az amerikai technológiai óriások alkotásainál. A történelem most kicsit ismétli önmagát, de ezúttal rutinosabban kezelhetik a helyzetet a nyugati cégek.
A DeepSeek megjelenése felrázta a piacot, komoly változásokat indított el, de amitől mindenki tartott, hogy pillanatok alatt átrendeződhetnek az erőviszonyok, az nem következett be. A Moonshot AI friss bejelentése is valamelyest hasonló helyzetet eredményezhet. A napokban lehullott a lepel a Kimi K2 névre hallgató nyelvi modellről, ami állítólag nagyon olcsón üzemeltethető, sokkal költséghatékonyabb, mint a GPT-4, ráadásul ez egy nyílt forrású nyelvi modell.
A Kimi kínai chatbot már egy ideje üzemel, nem egy teljesen ismeretlen piaci szereplőről van szó, az új K2 modell azonban mindenképpen meglepetést okozott. Az lehet tudni erről, hogy a Mixture-of-Experts architektúrát használja, és 1 billió paraméterrel rendelkezik, amiből 32 milliárd az aktív paraméterek száma. Programozásban kifejezetten erős a Kimi K2, de van gyengéje is, a multimodális működés például még fejlesztés alatt áll, de több terve is van a cégnek a jövőre nézve. A kontextusablak jelenleg 128 ezer tokenes.
Két verziót kínál belőle a Moonshot AI, van egy alapmodell, ami direkt a kutatóknak és a fejlesztőknek szól. Ezt lehet új szolgáltatások létrehozására, kutatási projektek megoldására alkalmazni. A másik egy instrukciókra hangolt változat, amit arra optimalizáltak, hogy a chatbotok keretében a lehető leghatékonyabban tudjon üzemelni. Emellett pedig már arra is fel van készítve ez utóbbi modell, hogy mesterséges intelligencia ügynököt építsenek rá a Moonshot AI partnerei, ez egy dinamikusan fejlődő üzletág, amiben most sokan próbálnak érvényesülni.
„A Kimi K2 nyelvi modell nem csak válaszol, hanem cselekszik. A Kimi K2-vel a fejlett ügynöki intelligencia minden eddiginél nyitottabb és elérhetőbb.” – olvasható a vállalat bejelentésében. A Moonshot hozzátette, hogy izgalommal várják, hogy milyen célokra fogják felhasználni az érdeklődők az új LLM eszközt.
Kiemelte a startup, hogy a nagy hatékonysággal lesz képes önálló működésre a modell. Kódot ír, végrehajtja, teszteli ezeket, és kiegészítésre is képes. Komplex feladatokat tud több lépésben végrehajtani anélkül, hogy embernek be kellene avatkoznia. A Moonshot egyik példájában 16 Python műveletet végez el, hogy statisztikai elemzést hozzon létre, amihez interaktív vizualizációt is létrehoz. Egy másik példában meg koncertet szervezett meg az MI 17 különböző eszközt használva platformokon átívelően. Munkára fogta a keresőt, a naptárat, a levelezőt, a repülésszervezőt, a szálláskeresőt és az étteremfoglaló szoftvert is.
A LiveCodeBench keretében 53,7 százalékos eredménnyel egyedüliként tudott 50% fölé menni. A második helyen a Claude 4 Opus modell már csak 47,4 százalékot tudott elérni. A GPQA Diamond keretében viszont az elmezőnynek csak a második felében van 76,6%-kal, ebben az ugyancsak új Grok 4 vezet 87,7 százalékos eredménnyel. Viszont minden jobb modell drágábban üzemeltethető, és ez is fontos szempont, valamint itt nyílt forrású alapról beszélhetőn, ami az élmezőnyben nem annyira jellemző.
A Moonshot AI elmondása alapján a Kimi K2 modell a feldolgozás oldaláról igazán költséghatékony, mindössze 0,15 dollárba kerül 1 millió token feldolgozása. A kimeneti tartalmakat tekintve azért már rosszabb a helyzet, itt 1 millió token után 2,5 dolláros árat von magával. Az ügynök munkában nagyon jó lehet majd azáltal, hogy a jelek szerint tényleg hatékonyan tud önállóan sok feladatot egymás után végrehajtani, és a költségei sem szállnak el eközben.