Reddit padit Perplexity dhe mbledhësit e të dhënave për vjedhje përmbajtjeje të inteligjencës artificiale (AI) në shkallë industriale
Reddit ngriti një padi federale në Nju Jork të mërkurën, duke akuzuar firmën e kërkimit të inteligjencës artificiale Perplexity dhe tre ndërmjetës të dhënash për një skemë “në shkallë industriale” për të mbledhur në mënyrë të paligjshme përmbajtjen e saj.

Në padinë e saj, Reddit pretendon se Perplexity, me ndihmën e SerpApi, Oxylabs dhe AWMProxy, anashkaloi masat e sigurisë për të vjedhur bisedat e përdoruesve direkt nga rezultatet e kërkimit në Google.

Një metodë e tillë anashkalon kanalet zyrtare të licencimit të Reddit, të cilat i përdorin partnerë si Google dhe OpenAI . Reddit pretendon se të pandehurit injoruan një letër ndërprerjeje dhe shkelën ligjin e të drejtave të autorit, duke përshkallëzuar betejën e industrisë së teknologjisë mbi përdorimin e drejtë të të dhënave për trajnimin e modeleve të inteligjencës artificiale.
Në zemër të mosmarrëveshjes është një metodë e re e mbledhjes së të dhënave që synon ndërmjetësit e internetit – motorët e kërkimit – në vend të vetë burimit.
Padia e Reddit pretendon se të pandehurit krijuan mjete për të anashkaluar mbrojtjet e Google kundër gërryerjes, duke i lejuar ata të mbledhin përmbajtje Reddit nga faqet e rezultateve të motorëve të kërkimit (SERP) në një shkallë masive.
Padia e saj rendit akuza të shumta, duke përfshirë konkurrencën e padrejtë, pasurimin e padrejtë dhe shkeljet e Aktit të të Drejtave të Autorit të Mijëvjeçarit Dixhital (DMCA).
Në një padi ligjore plot me gjuhë luftarake, Reddit i ka pozicionuar të pandehurit jo vetëm si shkelës të rregullave, por edhe si pjesëmarrës në një ekonomi të “pastrimit të të dhënave”.
“Kompanitë e inteligjencës artificiale janë të përfshira në një garë armatimi për përmbajtje njerëzore cilësore – dhe ky presion ka nxitur një ekonomi të ‘pastrimit të të dhënave’ në shkallë industriale.” Avokatët e kompanive argumentuan: “Në një kuptim shumë të vërtetë, këta të pandehur janë të ngjashëm me grabitësit e mundshëm të bankave, të cilët, duke e ditur se nuk mund të hyjnë në kasafortën e bankës, futen me forcë në kamionin e blinduar që mban paratë.”
Për të vërtetuar akuzat e saj, Reddit kreu një operacion dixhital. Krijoi një “postim testimi” të konfiguruar për t’u aksesuar vetëm nga programi i kërkimit i Google dhe askund tjetër në internet.
Brenda pak orësh, motori i përgjigjeve i Perplexity ishte në gjendje të riprodhonte përmbajtjen e postimit. Reddit pohon se kjo është provë e pakundërshtueshme e skemës, pasi e vetmja mënyrë që Perplexity mund t’i kishte marrë të dhënat ishte duke i marrë ato nga rezultatet e kërkimit të Google.
Arma kryesore ligjore e Reddit është DMCA. Në mënyrë specifike, ajo përdor Seksionin 1201, i cili e bën të paligjshëm anashkalimin e masave teknologjike që kontrollojnë aksesin në veprat e mbrojtura me të drejta autori. Reddit argumenton se si mbrojtjet e saj të faqeve ashtu edhe sistemi SearchGuard i Google kualifikohen si masa të tilla. Duke synuar aktin e anashkalimit, ligji ofron një mjet të fuqishëm kundër shërbimeve që mundësojnë mbledhjen e të dhënave, jo vetëm kundër atyre që e kryejnë atë.
Në themel të betejës ligjore është vlera e jashtëzakonshme e arkivit të gjerë të bisedave njerëzore të Reddit-it.
Një raport i kohëve të fundit nga firma analitike Profound konfirmoi se Reddit është domeni më i cituar në të gjitha modelet kryesore të IA-së, duke e bërë përmbajtjen e tij një burim kritik për trajnimin e modeleve të mëdha gjuhësore. Depozita e tij unike, e përditësuar vazhdimisht, e përvojës njerëzore është një minierë ari për industrinë e IA-së të etur për të dhëna.
Duke e njohur këtë, Reddit ka miratuar një strategji të fortë me dy drejtime: të fitojë para përmes partneritetit dhe të mbrohet përmes procesit gjyqësor.
Kompania ka nënshkruar marrëveshje fitimprurëse për licencimin e të dhënave me lojtarë të mëdhenj të inteligjencës artificiale, duke përfshirë një marrëveshje vjetore prej 60 milionë dollarësh me Google dhe një tjetër me OpenAI. Këto marrëveshje krijojnë një rrugë formale dhe të paguar për përmbajtjen e saj.
Njëkohësisht, Reddit ka treguar se do të ndjekë në mënyrë agresive kompanitë që beson se po përdorin të dhënat e saj pa leje.
Padia e saj e re vjen pas një padie të ngjashme ligjore të ngritur kundër startup-it të inteligjencës artificiale Anthropic në qershor 2025 për dyshime për përvetësimin e të dhënave pa licencë. Së bashku, këto raste sinjalizojnë një politikë të qartë dhe të palëkundur të mbrojtjes së të dhënave të saj si një aset kryesor i biznesit.
Ndërsa Perplexity mbështet publikisht aksesin e lirë në njohuri, padia e Reddit paraqet një pamje të një kompanie që i shmanget qëllimisht rregullave të platformës.
Sipas padisë, Reddit i dërgoi një letër ndërprerjeje Perplexity në maj 2024. Në vend që të zbatonte urdhrin, Reddit pretendon se përdorimi i përmbajtjes së saj nga Perplexity u rrit ndjeshëm, me citimet që u dyzetfishuan.
Duke përmendur SerpApi, Oxylabs dhe AWMProxy si bashkëpunëtorë, padia i akuzon ata për ofrimin e mjeteve teknike për të anashkaluar sigurinë. Ajo e përshkruan AWMProxy me ashpërsi të veçantë, duke cituar punën hetimore që e lidh atë me “ish-botnetin rus” Glupteba.
Detajet në dosje paraqesin një pamje tronditëse të shkallës së operacionit; Reddit pretendon se gjatë një periudhe të vetme dyjavore në korrik 2025, firmat e mbledhjes së të dhënave kanë aksesuar në mënyrë të paligjshme gati tre miliardë faqe kërkimi në Google që përmbanin përmbajtjen e tij.
Shefi ligjor i Reddit, Ben Lee, deklaroi: “Perplexity është një klient i gatshëm i të paktën njërit prej këtyre programeve kompjuterike, duke zgjedhur të blejë të dhëna të vjedhura në vend që të hyjë në një marrëveshje të ligjshme me vetë Reddit.”
Të gjithë të pandehurit e përmendur me emër i kanë mohuar me forcë akuzat. Në një deklaratë, Shefi i Komunikimit të Perplexity, Jesse Dwyer, tha: “Qasja jonë mbetet parimore dhe e përgjegjshme, ndërsa ofrojmë përgjigje faktike me inteligjencë artificiale të saktë, dhe nuk do të tolerojmë kërcënime kundër transparencës dhe interesit publik.”
Ryan Schafer, një drejtor në SerpApi, i tha Adweek: “Ne nuk pajtohemi fuqimisht me akuzat e Reddit dhe synojmë të mbrohemi fuqishëm në gjykatë.”
Drejtori i Qeverisjes dhe Strategjisë së Oxylabs, Denas Grybauskas, e përsëriti këtë, duke deklaruar se kompania “nuk do të hezitojë të mbrohet kundër këtyre akuzave”.
Për Perplexity, kjo nuk është hera e parë që përballet me akuza të tilla. Firma e inteligjencës artificiale po përballet tashmë me padi nga botues të mëdhenj, përfshirë News Corp, Encyclopedia Britannica dhe Merriam Webster.
Gjithashtu u akuzua publikisht nga firma e sigurisë në internet Cloudflare për përdorimin e ‘crawler-ave të fshehtë’ për të anashkaluar rregullat e faqeve të internetit dhe për të mbledhur përmbajtje nga faqet që e kishin ndaluar në mënyrë të qartë atë.
Kjo padi e fundit nga Reddit shton një tjetër sfidë të madhe ligjore në një listë gjithnjë e në rritje, duke i vënë praktikat e mbledhjes së të dhënave të Perplexity nën një shqyrtim të rreptë.
