Pronari i Tumblr po bën marrëveshje me OpenAI dhe Midjourney për të dhënat e trajnimit
Pronari i Tumblr dhe WordPress.com është në bisedime me kompanitë e AI Midjourney dhe OpenAI për të ofruar të dhëna trajnimi të fshira nga postimet e përdoruesve, një raport nga 404 Media. Raporti, i bazuar në një burim anonim brenda kompanisë, thotë se marrëveshjet midis Automattic dhe dy kompanive të AI janë “të pashmangshme”. Ai pason thashethemet e mjegullt që janë përhapur në Tumblr gjatë javës së kaluar, duke sugjeruar se një marrëveshje me Midjourney mund të sigurojë një rrjedhë të re të ardhurash për faqen.
Sipas raportit të 404, Automattic planifikon të lançojë një cilësim të ri të mërkurën që “do t’i lejojë përdoruesit të heqin dorë nga shkëmbimi i të dhënave me palët e treta, përfshirë kompanitë e AI”. Por ai citon postime të brendshme që sugjerojnë se kompania ka fshirë një “deponim fillestar të të dhënave” që përmban “të gjithë përmbajtjen e postimeve publike të Tumblr midis 2014 dhe 2023”, duke përfshirë – me sa duket gabimisht – përmbajtje që nuk do të ishte e dukshme publikisht në blog. Është e paqartë se çfarë është bërë me këto të dhëna dhe cilat të dhëna i janë dërguar Midjourney dhe OpenAI.
OpenAI dhe Midjourney nuk iu përgjigjën menjëherë kërkesave për koment nga Shkence.info. Automattic na drejtoi në një deklaratë publike që publikoi të martën pas raportit të 404. Postimi, i titulluar “Mbrojtja e zgjedhjes së përdoruesit”, aludon për partneritete me kompani të paidentifikuara të AI. “Aktualisht ne bllokojmë, si parazgjedhje, zvarritësit kryesorë të platformës së AI – duke përfshirë ato nga kompanitë më të mëdha të teknologjisë – dhe përditësojmë listat tona kur të rejat lançohen,” thotë ai, dhe “do të ndajmë vetëm përmbajtje publike që strehohet në WordPress.com dhe Tumblr nga faqet që nuk janë tërhequr.” Më tej theksohet se “ne po punojmë gjithashtu drejtpërdrejt me kompani të përzgjedhura të AI për sa kohë që planet e tyre përputhen me atë që interesohet komuniteti ynë: atribuimi, përjashtimet dhe kontrolli”.
Një numër kompanish kanë lidhur marrëveshje me prodhuesit e mjeteve të AI për të ofruar të dhëna trajnimi – të cilat historikisht janë hequr nga të dhënat e disponueshme publikisht në internet, një proces që është bërë ligjërisht më i rrezikshëm vitet e fundit. Reddit thuhet se ka një marrëveshje vjetore prej 60 milionë dollarësh me Google, ndërsa Shutterstock ka nënshkruar një marrëveshje me OpenAI për të trajnuar në bibliotekën e saj të fotografive. Por një numër artistësh dhe shkrimtarësh – me fjalë të tjera, komuniteti krijues të cilit Tumblr i shërben veçanërisht – kanë protestuar që puna e tyre të përdoret për trajnime. Kompanitë kanë luftuar për të ecur në një vijë midis kënaqjes së përdoruesve dhe eksperimentimit me mjete të reja AI, duke çuar në reagime kundër hapësirave në internet si DeviantArt që kanë flirtuar me teknologjinë.
Për momentin, nuk ka shumë informacione se çfarë do të sjellë ndonjë marrëveshje, as sa do të përfitojë Automattic prej saj. Kompania ka një biznes të gjatë të pritjes në internet me WordPress.com dhe WordPress VIP, të dyja të ndërtuara në softuerin WordPress me burim të hapur. Por ajo ka luftuar me një sërë metodash për fitimin e parave të Tumblr – të cilën e bleu nga Verizon në 2019 – dhe njoftoi se do të zvogëlonte ambiciet e saj për faqen vitin e kaluar.