A Microsoft jelenleg a világ legértékesebb vállalata a piaci kapitalizációja alapján, és az MI őrület repítette a világ tetejére. A cég folyamatosan dolgozik azon, hogy minél többet tudjon nyújtani ezen a területen az OpenAI-jal vagy éppen nélküle. Most a cég a saját fejlesztésű Phi nyelvi modell új generációjával állt elő.
Tavaly indította el a Microsoft a Phi LLM rendszerét, és decemberben jelent meg ennek a második főverziója, Phi-1 még 1,3 milliárd paraméterrel indított, és kezdetben alapvető programozási készségekkel rendelkezett. A Phi-2 már jobb képességekkel szolgált és kétszer nagyobb méretet öltött a paraméterkészlet szempontjából.
A redmondiak állítólag három különböző kisebb modellt szeretnének pályára vinni, és ezek közül az első a Phi-3 Mini. Készül ebből a Phi-3 Small és a Phi-3 Medium is, de azok még váratnak magukra. Hírünk főszereplője 3,8 milliárd paraméteres, és a tréningezése kisebb adatcsomagokon zajlott. Ez lényegesen kisebb az OpenAI által kínált GPT-4-nál, nagyjából a Gemini Nano modell szintjére tehető.
Jövőben érkező Phi-3 Small már 7 milliárd paraméteres lesz, a Phi-3 Medium pedig még tovább fog hízni, és 14 milliárd paraméterrel kecsegtet majd. Még a Phi-3 Medium is a kisebb LLM megoldások sorát fogja gyarapítani. A Phi-3 Mini mostantól elérhető az Azure, a Hugging Face és az Ollama keretében az érdeklődők számára.
Kicsi a bors, de erős. A Phi-3 Mini a tízszer több paraméterrel dolgozó modellek közelében jár majd a teljesítményét tekintve, és sok riválisát könnyű szerrel körözi le.
A szoftveróriás elmondása alapján a Phi-3 Mini a méretéhez képes rendkívüli teljesítményt fog biztosítani. Közel olyan pontossággal ad majd válaszokat az újdonságot alkalmazó generatív MI, mint a nála sokkal nagyobb nyelvi modellekre támaszkodó mesterséges intelligenciák. A The Verge-nek Eric Boyd, a Microsoft Azure AI Platform alelnöke azt nyilatkozta, hogy a Phi-3 Mini majdnem olyan ügyes lesz, mint a GPT-3.5 volt, miközben annál lényegesen kisebb a mérete. Az első teszteredmények is bizakodásra adnak okot.
A kis méret azért nagyon hasznos, mert ennek köszönhetően be lehet majd vetni helyben futtatva is. Személyi számítógépeken és okostelefonokon is gond nélkül fog üzemelni a Phi-3 Mini. Ennek köszönhetően a jövőben akár több alkalmazás is elkezdhet erre építeni. A Microsoft azt is elárulta, hogy a tanítás nem a megszokott módon zajlott ebben az esetben. Itt egy „tantervet” állítottak össze a fejlesztők, és a mesterséges intelligenciát úgy trenírozták, mint ahogyan a kisgyerekek is tanulnak a mesekönyvekből. Mivel nem volt elegendő mennyiségű könyv erre a célra, így nagyobb generatív MI által létrehozott gyerekmeséket is felhasználtak a munka során.
Az elmúlt időszakban már egyre többször lehet arról hallani, hogy generatív MI által előállított tartalmakkal tanítottak fel új rendszereket. Ezek az eljárások egyre kifinomultabbak lesznek, és egészen jó eredményeket hoznak, ami a jövő szempontjából mindenképpen érdekes. A Phi-3 Mini kódolásban és érvelésben egyaránt jól fog teljesíteni a Microsoft ígérete szerint, miközben az emberek a mobiljukon elérhetik majd. A cég úgy gondolja, hogy ez egyedi adatokat felhasználva is hasznos lesz, így vállalkozások például belső információk, adatok feldolgozására is biztonsággal és hatékonyan alkalmazhatják.