Meta dyshohet se ka piratuar 81.7 TB libra për të trajnuar AI

Emailet e sapopambyllura supozohet se ofrojnë “provat më të dëmshme” deri më tani kundër Metës në një çështje për të drejtën e autorit të ngritur nga autorët e librave duke pretenduar se Meta ka trajnuar në mënyrë të paligjshme modelet e tij të AI për libra pirate.

Muajin e kaluar, Meta pranoi se kishte përrua një grup të dhënash të madhe të diskutueshme të njohur si LibGen, i cili përfshin dhjetëra miliona libra pirate. Por detajet rreth torrentit ishin të turbullta deri dje, kur emailet e paredaktuara të Metës u bënë publike për herë të parë. Provat e reja treguan se Meta përrua “të paktën 81.7 terabajt të dhëna nëpër biblioteka të shumta hije përmes faqes Anna’s Archive, duke përfshirë të paktën 35.7 terabajt të dhëna nga Z-Library dhe LibGen”, thuhet në dosjen gjyqësore të autorëve. Dhe “Meta gjithashtu përrua më parë 80.6 terabajt të dhëna nga LibGen.”

“Madhësia e skemës së paligjshme të përruajeve të Metës është e habitshme,” pretendohet në dosjen e autorëve, duke këmbëngulur se “akte shumë më të vogla të piraterisë së të dhënave – vetëm 0,008 për qind e sasisë së veprave me të drejta të autorit të piratuara nga Meta – kanë rezultuar që gjyqtarët t’ia referojnë sjelljen zyrës së prokurorisë së SHBA-së për hetime penale.”
Autorët e librave i kishin kërkuar Meta-s për më shumë informacion mbi përrua për shkak të shqetësimit të qartë të të drejtave të autorit mbi mbjelljen e Meta-s, dhe kështu duke shpërndarë në dukje, librat e piratuar në mosmarrëveshje.
Por Meta i rezistoi këtyre përpjekjeve për zbulim pasi një urdhër refuzoi kërkesën e autorëve për të rishikuar të dhënat e torrentimit dhe mbjelljes së Metës. Kjo nuk i ndaloi autorët të mblidhnin prova gjithsesi, duke përfshirë një dokument kyç që fillon me të paktën një punonjës që duket se bën shaka në mënyrë të pakëndshme për rreziqet e mundshme ligjore, duke u bërë më serioz në lidhje me ngritjen e shqetësimeve të tij.
“Përrua nga një laptop i korporatës nuk ndihet mirë,” shkroi Nikolay Bashlykov, një inxhinier kërkimor i Meta, në një mesazh të prillit 2023, duke shtuar një emoji të buzëqeshur. Në të njëjtin mesazh, ai shprehu “shqetësimin për përdorimin e adresave IP të Meta ‘për të ngarkuar përmes torrenteve përmbajtje pirate'”.
Deri në shtator 2023, Bashlykov me sa duket i kishte hequr emoji-t, duke u konsultuar drejtpërdrejt me ekipin ligjor dhe duke theksuar në një email se “përdorimi i torrenteve do të përfshinte ‘mbjelljen’ e skedarëve—dmth., ndarja e përmbajtjes jashtë, kjo mund të ishte ligjërisht në rregull.”
Emailet që diskutojnë për torrentin provojnë se Meta e dinte se ishte “ilegale”, pretenduan autorët. Dhe paralajmërimet e Bashlykov me sa duket erdhën në vesh të shurdhër, me autorët që pretenduan se provat treguan se Meta zgjodhi të fshihte torrentin e tij sa më mirë që të mundej, ndërsa shkarkonte dhe ruante terabajt të dhëna nga biblioteka të shumta hije deri në prill 2024.
Supozohet se Meta u përpoq të fshihte farën duke mos përdorur serverët e Facebook gjatë shkarkimit të grupit të të dhënave për të “shmangur” “rrezikun” e kujtdo që të “gjurmojë prapa sajuesin/shkarkuesin” nga serverët e Facebook, tha një mesazh i brendshëm nga studiuesi i Meta, Frank Zhang, ndërsa e përshkroi punën si në “modalitet vjedhurazi”. Meta gjithashtu dyshohet se modifikoi cilësimet “në mënyrë që të mund të ndodhte sasia më e vogël e mundshme e mbjelljes”, tha në një depozitë një ekzekutiv i Meta-s përgjegjës për menaxhimin e projektit, Michael Clark.
Tani që informacionet e reja kanë dalë në dritë, autorët pohojnë se stafi i Meta-s i përfshirë në vendimin për torrentin e LibGen duhet të shkarkohet përsëri sepse faktet e reja dyshohet se “kundërshtojnë dëshmitë e mëparshme të depozitimit”.
Mark Zuckerberg, për shembull, pretendoi se nuk kishte asnjë përfshirje në vendimet për të përdorur LibGen për të trajnuar modelet e AI. Por mesazhet e pa redaktuara tregojnë se “vendimi për të përdorur LibGen ndodhi” pas “një përshkallëzimi paraprak në MZ”, pretenduan autorët.
Meta nuk iu përgjigj menjëherë kërkesës së Ars për koment dhe ka pohuar gjatë gjithë procesit gjyqësor se trajnimi i AI në LibGen ishte “përdorim i drejtë”.
Megjithatë, Meta e ka adresuar më parë torrentin e saj në një mocion për shkarkimin e paraqitur muajin e kaluar, duke i thënë gjykatës se “paditësit nuk pretendojnë asnjë rast të vetëm në të cilin ndonjë pjesë e ndonjë libri, në fakt, është shkarkuar nga një palë e tretë nga Meta nëpërmjet torrentit, aq më pak që librat e paditësve janë shpërndarë disi nga Meta”.
Ndërsa Meta mund të jetë i sigurt në strategjinë e saj ligjore, pavarësisht nga rrudhat e reja, kompania e mediave sociale në dukje e ka komplikuar çështjen e saj duke lejuar autorët të zgjerojnë teorinë e shpërndarjes që është çelësi për të fituar një pretendim të drejtpërdrejtë për shkeljen e të drejtës së autorit përtej pretendimit se rezultatet e AI të Metës shpërndanë në mënyrë të paligjshme veprat e tyre.
Ndërsa zbulimi i kufizuar mbi mbjelljen e Metës po vazhdon tani, Meta nuk po lufton në këtë moment aspektin fillestar të pretendimit të drejtpërdrejtë të shkeljes së të drejtës së autorit, duke i thënë gjykatës se ka në plan të “përcaktojë… rekordin dhe të zhvlerësojë… këtë pretendim të pameritë mbi gjykimin e përmbledhur”.