A mesterséges intelligencia terepen a Microsoftot eléggé nehéz elhelyezni. A vállalat dollármilliárdokat fektetett a nyelvi modellek és MI eszközök területébe, de a pénz jelentős részével igazából az OpenAI-t támogatta. Ettől függetlenül viszont saját projekteken is dolgozik, és ennek eredményeként futott most be kettő nyelvi modell is.
A redmondiak a Microsoft AI részlegen fejlesztik a saját LLM megoldásaikat, és ezek ebből eredeztethetően MAI néven érkeznek. A MAI-1-preview és a MAI-Voice-1 néven futottak be.
A MAI-Voice-1 akár több perces hanganyagokat képes előállítani, és állítólag akár egyetlen Nvidia GPU is elég a futtatásához. Azt azonban nem fedte fel a Microsoft, hogy milyen GPU-ra kell itt gondolnunk, a lényeg az, hogy jó hatékonysággal üzemel. A MAI-1-preview pedig a cég első teljesen önállóan fejlesztett és tanított alapmodellje, ami „előzetes betekintést ad abba, hogy a jövőben mit kínálhat a Copilot”.
Nagyon ambiciózus a Microsoft azzal kapcsolatosan, hogy mire lesz képes a jövőben, mit tud majd nyújtani a felhasználók számára. „Aktívan dolgozunk azon, hogy lendületesen szállítsuk az egyre fejlettebb modelleket. És a következő hónapokban még sokkal több információt oszthatunk majd meg veletek.” – hangoztatta a vállalat a hivatalos beszámolójában.
A cég állítólag az általános nyelvi modellek mellett több speciális projekten dolgozik, így szeretné átadni az óriási értékeket, amiket nyújtani képes az embereknek. Különleges felhasználói igényekhez különleges modellek dukálnak, így leget minden igényt a legjobban kiszolgálni a cég szerint. Rövid és hosszútávú fejlesztések egyaránt terítéken vannak, de ezekről csak később fog részletesebben beszámolni a Microsoft.
MAI-Voice-1
Szeretnéd kipróbálni, hogy mire képes a MAI-Voice-1? Nos, ezt minden további nélkül megteheted, csak egy Microsoft fiókra van szükség hozzá. Copilot Labs égisze alatt fut az eszköz Copilot Audio Expressions néven, és lehetőséget nyújt az új hang modell tesztelésére, próbálgatására. Még előzetes verzióban fut ez, ami azt jelenti, hogy lehetnek a működése közben anomáliák. Hibázhat is a modell, mint minden generatív MI. A MAI-Voice-1 magyarul jelenleg nem tud, de sok érdekes lehetőséget biztosít.
Rendkívül széles skálán lehet konfigurálni, hogy milyen stílusban beszéljen az újdonság. Kilenc hangszínből lehet választani, férfi és női hangok egyaránt elérhetők, ezen felül pedig megadható, hogy milyen stílusban menjen a beszéd. Több mint két tucat lehetőséget vonultat fel ilyen téren a cég, így összesen több száz beállításban lehet a hangos válaszokat meghallgatni. Van külön történetmesélő mód is, amiben minden promptra egy rövid mesét generál és olvas fel a szolgáltatás. A válaszok letölthetők, és igény szerint meg is oszthatók.
Gyorsan teszi a dolgát a MAI-Voice-1, de közel sem valós időben tud válaszolni az emberek által bevitt kérdésekre, utasításokra. Ez a modell már Copilot Daily és a Microsoft Podcasts szolgáltatások keretében is megjelenik.
A MAI-1-preview
A Microsoft a MAI-1-preview kapcsán elmondta, hogy ez a modell a mostanában nagy népszerűségnek örvendő MoE (Mixture-of-Experts) architektúrát használja, és többféle módszert használtak a training során, hogy a lehető legjobb teljesítményt érjék el vele. Több mint 15 ezer Nvidia H100 dolgozott a modell tanításán.
Ez egy általános célú nyelvi modell, ami különösen jó lesz például az instrukciók követésében, és részben ennek köszönhetően nagyon hasznos és pontos válaszokkal szolgálhat a mindennapos beszélgetésekben. A MAI-1-preview fokozatosan meg fog jelenni a Copilot mögött, kisebb-nagyobb feladatok megoldását erre fogja kiosztani a Microsoft, idővel pedig teljesen áttérhet a MAI modellek alkalmazására, és akár el is hagyhatja majd a GPT-t. Már amennyiben sikerül megfelelő szintre fejleszteni a modellt.