Sok különböző képgeneráló szolgáltatás létezik mostanra, és az olyan nagy piaci szereplők mellett, mint a DALL-E, Midjourney, valamint a Stable Diffusion, egyre nehezebb kitűnni a tömegből. Azonban a Black Forest Labsnak sikerült a Flux esetében egy igazán versenyképes megoldással előállnia.
A Flux modell nevét akkor ismerte meg igazán széles közönség, mikor a nyár folyamán kiderült, hogy az xAI által fejlesztett Grok chatbot keretében bevezetett képgenerátort ez a modell táplálja. A Flux.1 nagyon jól teljesített számos különböző teszt keretében, és rengeteg ember kapott rá a bevezetését követően. Persze a népszerűségét részben annak köszönhette, hogy nagyon laza pórázon fogták. Minden további nélkül létrehozott valós személyekkel, különböző élethelyzetekben, a valóságtól teljesen elrugaszkodott képeket.
A Black Forest Labs fejlesztői remek munkát végeztek, és azóta is folyamatosan dolgoznak a modellen, aminek most elkészült a Flux1.1 (pro) verziója. Jelentős előrelépést ígér a vállalat, és már tesztek bizonyítják, hogy egyelőre kiválóan teljesít.
Hatszor gyorsabb lett a Flux1.1 (pro), mint a Flux.1 (pro) volt, miközben jobb képminőséget nyújt, határozottabban követi az utasításokat, és a diverzitása is nagyot fejlődött.
A Flux1.1 (pro) sokkal kisebb késleltetés mellett lesz képes ellátni a feladatát a jelentős gyorsulásnak köszönhetően, így lényegesen hatékonyabb lehet vele a munka. A Black Forest Labs csapat elmondta, hogy arra törekedtek, hogy a minőség és a tempó között az ideális egyensúlyt találják meg. A technológiai háttérbe a fejlesztők nem sok betekintést engedtek, ami igazából nem különösebben meglepő. Jelenleg ezen a területen nagy a verseny, és a cégek igyekeznek minél kevesebb információt publikálni a megoldásaikkal kapcsolatosan.
Az újdonságot előzetesen „blueberry” kódnéven már tesztelni kezdte a Black Forest Labs, és az Artificial Analysis képgenerálási tesztjében minden más modellt maga mögé utasított a Flux1.1 (pro), de már a Flux.1 (pro) is vezette a mezőnyt. Ebben a tesztben az emberek vakon választják ki, melyik képet ítélik jobbnak, és a Flux1.1 (pro) az összevetések 69 százalékában diadalmaskodik olyan modellekkel szemben, mint a Midjourney, a DALL-E vagy egyebek mellett a Stable Diffusion.
Azt is kiemelte a Black Forest Labs, hogy a képgenerátor MI eszközök jelentős részénél olcsóbban üzemeltethető a Flux modell. A (pro) jelzővel illetett LLM rendszerek mellett kínál a vállalat egy szerényebb Flux.1 (dev) opciót is, ami még olcsóbb, és van a cégnek egy egészen kicsi Flux.1 (schnell) modellje is, ami szó szerint filléres fenntartási költség mellett képes dolgozni, és még így is megelőzi például a DALL-E 3 HD-t.
Sebességben a Flux.1 (schnell)-nek jóformán nincs riválisa, erre is büszke a Black Forest Labs. Miközben azt is hozzátették, hogy már dolgoznak egy olyan modellen, ami tényleg magas felbontást lesz képes nyújtani. Akár „2K” képeket is létre lehet majd hozni a Flux1.1 (pro) képességeit kamatoztatva. Erre azonban most még várni kell.
Miközben megérkezett az új modell, a korábbin is dolgoztak még a fejlesztők, ennek köszönhetően a korábbinál gyorsabban teszi majd a dolgát a Flux.1 (pro) azokon a helyeken, ahol már ezt alkalmazzák. Fele annyi idő alatt generálja ugyanazokat a képeket, mint korábban. Ez mindenképpen jó hír a más meglévő partnerek számára, ennek a hatása talán már a Grok chatbotnál is érzékelhető lesz, de erre külön nem tértek ki.
Folyamatosan épül a BFL API
Ugyancsak fontos fejlesztés a cégtől a BFL API, ami béta fázisba ért. Ennek köszönhetően a fejlesztők, üzleti partnerek közvetlenül integrálhatják az alkalmazásaikba a Flux képgeneráló mesterséges intelligencia szolgáltatás elérését. A Black Forest Labs számára a BLF API nagy jelentőséggel bír, hiszen ezáltal egy újabb bevételi forráshoz juthatnak.
Az elmondottak alapján a BLF API kiváló testreszabási lehetőségeket biztosít majd a kliensek számára. Szabadon lehet alakítani az eszközt olyan formán, hogy milyen felbontású képeket hozzon létre, természetesen választható a modell is, és lehet egyedi tartalommoderálást alkalmazni. Kiváló skálázhatóságról is gondoskodik a fejlesztés, és nagyon versenyképes árazással szolgál a már említett újítások révén.
A Flux.1 (pro) jelenleg a legdrágábban alkalmazható, de normál esetben ezzel sem kerül többet egy kép létrehozása 5 centnél. Akik beérik a szerényebb képességű Flux.1 (dev) modellel, azok megússzák 2,5 centből a képek generálását, az új Flux1.1 (pro) esetén pedig 4 centes költséggel kell számolni képenként. Idővel a BLF API még több modellhez nyújt majd hozzáférést.