Az X új szabályzata tiltja az MI tréningezést a felhasználói adatokkal…

AZ X ÚJ SZABÁLYZATA TILTJA AZ MI TRÉNINGEZÉST A FELHASZNÁLÓI ADATOKKAL…

… ez azonban egyáltalán nem jelenti azt, hogy az X bejegyzéseket nem fogják felhasználni MI eszközök tanítására.

Szécsi Dániel (DemonDani)

A közösségi média egy aranybánya a mesterséges intelligencia számára. Rengeteg információt lehet felszívni ezekből a szolgáltatásokból, és nagyon hatékonyan tréningezhetők, finomhangolhatók a nyelvi modellek a nagy platformokról beszerzett adatokból. Ezt viszont egyre többen igyekeznek megakadályozni.

Mostanra nincs olyan közösségi média felület, aminek a felhasználási irányelveibe ne lenne rögzítve több szabály is annak kapcsán, hogy a mesterséges intelligencia milyen formában nyúlhat hozzá az adatokhoz. Hol felületesebb, hol részletesebb előírásokkal lehet találkozni erre vonatkozóan. A cégek pedig jobban teszik, ha komolyan veszik az előírásokat, különben könnyen lehet, hogy megütik a bokájukat.

A Reddit vezetése a napokban úgy döntött, hogy bepereli az Anthropic-ot tiltott adatszerzési tevékenység miatt. Az OpenAI riválisa a vád szerint több mint 100 ezer alkalommal „kapargatott” információkat a Redditről tavaly júliusban. Miközben a Reddit már hetekkel korábban rendelkezett arról, hogy nem férhetnek hozzá MI tréningezési céllal a felhasználói adatokhoz a technológiai cégek. A vállalat állítólag egyértelműen bizonyítani tudja az Anthropic tiltott tevékenységét, ami nem sok jót vetít előre az alperes szempontjából.

Ezúttal viszont nem a Reddit ügyével kívánunk foglalkozni, arról egyelőre nem sokat lehet tudni, és valószínűleg sokáig fog húzódni, mire bármilyen ítélet születik, a végleges eredmény pedig még tovább várathat majd magára. A friss hír az, hogy már az X is a Reddithez hasonlóan rendelkezik az adatok felhasználhatóságáról.

A mikroblog frissítette az adatvédelmi előírásokat, és innentől egyértelműen megtilt minden engedély nélküli adatbeszerzést az X felületéről és/vagy a kapcsolódó API-ból nyelvi modellek vagy mesterséges intelligencia eszközök finomhangolásához vagy tréningezéséhez.

Az X közkedvelt információforrás, főleg az Egyesült Államokban, de a világ más tájain is használják bejelentésekre és hírközlésre különböző médiumok, politikai szereplők, különböző szervezetek. Éppen ezért joggal igyekszik megóvni a felhasználói adatokat a platform az illetéktelenektől. Nem titok, hogy szinte minden generatív MI szolgáltatás merített korábban a mikroblogon fellelhető információkból, és ennek szeretne gátat szabni Elon Musk csapata.

Viszont az ki kell emelni, hogy ez nem jelenti azt, hogy ne használnák fel ilyen célra a felületen megjelenő adatokat. Az X nagyon szorosan kapcsolódik az xAI-hoz, lényegében az utóbbi már be is kebelezi a mikroblogot, és korábban is egyértelművé tették, hogy a Grok tréningezéséhez és működéséhez felhasználják az bejegyzéseket – a személyes adatokat nem. Az X folyamról származó adatokat valós időben használja már a Grok, ennek köszönhetően képes naprakész válaszokkal szolgálni az embereknek.

Ráadásul külön megállapodást kötve továbbra is hozzáférhetnek vállalatok az X-hez ilyen céllal. Természetesen innentől ez már rendkívül jövedelmező lehet az X számára, és mivel a mikroblogon fellelhető adatok valóban nagyon értékesek, így meglehet, hogy jó megállapodásokat tud majd kalap alá hozni a platform vezetése. Ha csak nem azt az utat választják, hogy a Grok chatbotot ilyen módon juttatják előnyhöz a konkurensekkel szemben.

A Redditre visszatérve, ott például a Google az, akivel biztosan van megállapodás a felhasználói adatok felhasználásáról. Sokat nem lehet tudni arról, hogy mi áll a szerződésben, de állítólag évente 60 millió dollár ütheti a Reddit markát azért cserébe, hogy a Google-nek valós idejű hozzáférést biztosít az adatokhoz a nyelvi modellek tréningezésére.

nem elérhető

Üres a kosarad!

Termék

nem elérhető

AZ X ÚJ SZABÁLYZATA TILTJA AZ MI TRÉNINGEZÉST A FELHASZNÁLÓI ADATOKKAL…

TOP 5 AZ IPON-ON