Botuesit e librave padisin Meta për kopjim ‘fjalë për fjalë’ nga AI

foto

Meta po përballet me një padi kolektive të ngritur nga pesë botues të mëdhenj librash dhe një autor për pretendimet se kompania “është përfshirë në një nga shkeljet më masive të materialeve me të drejta autoriale në histori” gjatë trajnimit të modeleve të saj të inteligjencës artificiale Llama, siç është raportuar më parë nga The New York Times. Në padinë e tyre, Macmillan, McGraw Hill, Elsevier, Hachette, Cengage dhe autori Scott Turow pretendojnë se Meta “ka kopjuar vazhdimisht” librat dhe artikujt e tyre të revistave pa leje.

foto

Padia akuzon Metën për vjedhje me vetëdije të punimeve me të drejta autoriale nga “faqe të njohura pirate”, të tilla si LibGen, Anna’s Archive, Sci-Hub, Sci-Mag dhe të tjera, dhe më pas për futjen e këtij materiali në modelin e saj të inteligjencës artificiale. Gjithashtu pretendohet se Meta e trajnoi Llamën me informacion brenda të dhënave Common Crawl, i cili dyshohet se është “plot me kopje të paautorizuara të punimeve me të drejta autoriale”. Si rezultat, Llama “nxjerr zëvendësues fjalë për fjalë dhe pothuajse fjalë për fjalë” të materialit me të drejta autoriale:

foto

Për shembull, kur i kërkohet me dy fjali të shkurtra nga libri shkollor më i shitur i Cengage-it, Calculus: Early Transcendentals, botimi i 9-të, nga James Stewart, Llama fillon të riprodhojë fjalë për fjalë vazhdimin e seksionit.

Disa autorë e kanë paditur tashmë Metën për shkelje të dyshuar të të drejtave të autorit, gjë që nxori në dritë diskutimet e brendshme të kompanisë rreth mënyrës së trajtimit të “mbulimit mediatik që sugjeron se kemi përdorur një grup të dhënash që e dimë se është piratuar”. Vitin e kaluar, një gjykatës federal vendosi në favor të Metës në njërën nga këto padi, megjithëse ai theksoi se vendimi i tij “nuk qëndron në mbështetje të propozimit se përdorimi i materialeve të mbrojtura me të drejta autori nga Meta për të trajnuar modelet e saj gjuhësore është i ligjshëm”.

Një grup autorësh paditën gjithashtu Anthropic për shkelje të të drejtave të autorit. Ndërsa një gjykatës federal vendosi që trajnimi i modeleve të inteligjencës artificiale në libra të blerë ligjërisht pa leje konsiderohet përdorim i drejtë, ai i lejoi autorët të vazhdonin me një padi kolektive për “miliona” vepra që Anthropic dyshohet se ka piratuar. Anthropic pranoi t’u paguante shkrimtarëve 1.5 miliardë dollarë vitin e kaluar për të zgjidhur padinë kolektive.

Turow dhe grupi i botuesve po padisin Meta-n për dëmshpërblim dhe kërkojnë që gjykata të urdhërojë kompaninë të bllokojë aktivitetet e saj të dyshuara si të paligjshme. Ata gjithashtu i kërkojnë gjykatës të kërkojë nga kompania të ofrojë një listë të librave, artikujve të revistave dhe veprave të tjera të mbrojtura me të drejta autoriale mbi të cilat ka trajnuar modelet e saj të inteligjencës artificiale Llama.

“IA po fuqizon inovacionet transformuese, produktivitetin dhe kreativitetin për individët dhe kompanitë, dhe gjykatat me të drejtë kanë vendosur se trajnimi i IA-së mbi materiale të mbrojtura me të drejta autoriale mund të kualifikohet si përdorim i drejtë”, tha zëdhënësi i Meta-s, Dave Arnold, në një deklaratë me email për Shkence.info. “Ne do ta luftojmë këtë padi në mënyrë agresive.”