A Microsoft AI, röviden MAI meglehetősen dinamikusan bővült az idei évben, és a redmondiak a Build 2026 fejlesztői konferenciára tartogatták a legfontosabb bejelentést. Nagyon úgy fest, hogy a cég szép lassan szeretné a kezébe venni az összes mesterséges intelligencia eszköz fejlesztését ahelyett, hogy mások megoldásaira támaszkodna.
Korábban a Microsoft több milliárd dollárt lapátolt bele az OpenAI és az Anthropic támogatásába kisebb projektek finanszírozása mellett. Viszont egy ponton a cég úgy határozott, hogy ez a stratégia nem éppen ideális, és ilyen beruházások mellett maga is képes kifejleszteni az egyedi igényeire szabott modelleket. Májusban már az a hír járta, hogy a cég sorra bontja a szerződéseit a partnereivel, így például a Claude Code-nak is búcsút int.
A Build 2026 keretében pedig bejelentette a cég a MAI-Thinking-1 érkezését, ami az első valódi zászlóshajója, egy olyan érvelési modell, ami képes lesz felvenni a versenyt a Geminivel, a GPT-vel és a Claude-dal is. Ezt a redmondiak elvileg teljesen “tiszta adatokkal” tanították fel az alapoktól, és egyáltalán nem kapcsolódik semmilyen harmadik féltől származó fejlesztéshez – nem más modellekből kivont adatok szolgáltatták a traininghez az alapot.
A fejlett érvelési képességeit kihasználva kiválóan teljesít majd összetett matematikai problémák megoldásában, valamint jól fog teljesíteni a szoftverfejlesztési kihívásokban. A tervek szerint a Microsoft a MAI-Thinking-1 modellt alkalmazza majd a saját szolgáltatásaiban, és a mérnöki gárdája is ezzel dolgozik majd a házon belül zajló munka során. Azonban egyelőre még túl sok részletet nem fedett fel a Microsoft az első generációs érvelési modellje kapcsán.
A cég azt mondta, hogy jelenleg egy közepes méretű modellről beszélhetünk, amit úgy kell értelmezni, hogy a paraméterkészletet tekintve egyelőre nem a valódi csúcsmodellek szintjén mozog. MoE architektúrát használ, összesen 1 billió paraméterrel, amiből egyszerre legfeljebb 35 milliárd lehet aktív. A többi fejlesztő sem feltétlenül a legnagyobb modellekkel indítja egy-egy friss fejlesztés bevezetését (a Gemini 3.5-ből is a Flash jött először legutóbb). Arra is utalt a Microsoft, hogy a Claude Sonnet 4.6-hoz képest vakteszten az emberek jobbnak ítélték a MAI-Thinking-1 válaszait, de jól tudjuk, hogy ez közel sem a legjobb eszköze az Anthropic-nak.
A Build alkalmával a Microsoft bejelentett több olyan modellt, melyek egy-egy területre fókuszálnak. Ilyen például a MAI-Code-1-Flash, amely a programozási feladatok megoldását a hatékonyság szempontjából fogja megközelíteni. Ez kifejezetten olcsón lesz üzemeltethető, így hosszan lehet vele dolgozni minimális keret mellett is. Ezt elvileg a vállalat elsősorban a GitHub Copilothoz alkotta, és 5 milliárd aktív paraméterrel fog üzemelni. Állítólag még a hasonló méretű és képességű modelleknél is gazdaságosabban fog üzemelni.
Létrehozott a vállalat külön szöveges átiratok alkotására is egy modellt, a MAI-Transcribe-1.5 a cég szerint “a világ legjobb transzkripciós modellje”, és minden eddiginél kiválóbb pontossággal fog üzemelni. A Microsoft beszámolója szerint szaknyelven is jól fog teljesíteni, 43 nyelvet ismerve indul, és a vetélytársainál akár ötször gyorsabb lehet. Jön a MAI-Voice-2 is, amivel pedig természetes beszédhangot lehet előállítani 15 nyelvet támogatva. Ebből már készül a Flash verzió, amit valószínűleg digitális asszisztensnél is lehet majd használni.
Végül érkezik a MAI-Image-2.5 modell is, ami a képgenerálásra lesz kihegyezve. A Microsoft márciusban a MAI-Image-2-t már úgy indította el, hogy az a legjobb modellekkel egy szinten mozog a minőségét tekintve, és az újdonság már megelőzi a Nano Banana Prót is. Egy “világklasszis szövegből képet generáló modell” született a cégnél, aminek rögtön bevezetésre kerül a Flash verziója is, ami ultrahatékony működést ígér.
Érdekes lesz majd azt látni, hogy a felhasználóknak mennyire fognak beválni a Microsoft különböző nyelvi modelljei. A szoftveróriás mindenképpen komoly reményeket táplál ezek iránt. Mindegyik eszköz teljesen saját fejlesztés, amire rendkívül büszke a cég.