Reddit padit Anthropic për përdorimin e përmbajtjes së faqes për të trajnuar Claude

foto

Reddit ka ngritur një padi kundër Anthropic në Gjykatën e Lartë në San Francisko, duke akuzuar startup-in e inteligjencës artificiale për mbledhjen sistematike të postimeve të Reddit për të trajnuar modelet e saj të gjuhës Claude pa leje.

foto

Sipas marrëveshjes së përdoruesit të platformës, përdorimi komercial i përmbajtjes së Reddit kërkon një licencë të qartë. Reddit thotë se Anthropic e injoroi atë rregull, anashkaloi mbrojtjet teknike si skedarët robots.txt dhe kufijtë e shpejtësisë të bazuar në IP, dhe nuk u lidh kurrë me API-në e pajtueshmërisë së Reddit – mjeti që u tregon licencuesve kur një përdorues fshin një postim në mënyrë që ai të mund të hiqet nga sistemet e tyre.

foto

Sipas padisë, Anthropic ka pranuar publikisht përdorimin e të dhënave të Reddit në hulumtimet e kaluara dhe madje ka listuar më shumë se 40 subreddits – duke përfshirë r/science, r/IAmA dhe r/relationship_advice – si burime “cilësie të lartë” për trajnimin e Claude. Reddit thotë se Anthropic i mblodhi ato të dhëna pa pëlqimin e tij dhe pavarësisht këtyre masave mbrojtëse.

Padia thotë se një zëdhënës i Anthropic pretendoi në korrik 2024 se Reddit kishte qenë në listën e bllokuar të ClaudeBot që nga maji. Regjistrat e brendshëm të Reddit tregojnë një histori tjetër, duke treguar më shumë se 100,000 klikime nga botët e Anthropic në serverat e Reddit në muajt pas këtij pretendimi.

Padia e Reddit akuzon Anthropic për shkelje të shumta ligjore, nga shkelja e kontratës deri te konkurrenca e padrejtë. Platforma kërkon dëmshpërblim për të ardhurat e humbura nga licencimi, duke kërkuar që Anthropic të fshijë të gjitha modelet dhe grupet e të dhënave të inteligjencës artificiale që përmbajnë përmbajtje të Reddit, dhe duke i kërkuar gjykatës të parandalojë Anthropic nga përdorimi komercial i Claude ose çdo modeli të inteligjencës artificiale të trajnuar në të dhënat e Reddit.

Reddit argumenton se veprimet e Anthropic kërcënojnë si interesat e biznesit të kompanisë ashtu edhe privatësinë e përdoruesve të saj. Pa një licencë ose një lidhje me API-në e pajtueshmërisë, nuk ka asnjë mënyrë për të konfirmuar nëse postimet e fshira ose të ndjeshme janë ende të integruara në Claude.

“Nëse palë të tilla si Anthropic mbledhin përmbajtje të Reddit pa një marrëveshje licencimi, përdoruesit e Reddit nuk gëzojnë asnjë nga mbrojtjet e pranishme në Politikën e Përmbajtjes Publike dhe Politikën e Privatësisë të Reddit, pjesërisht, sepse përdoruesit e Reddit nuk kanë asnjë mënyrë për të ditur se cilat palë kanë mbledhur dhe marrë të dhënat e tyre”, thuhet në padi.

Platforma vëren se kompani të tjera të inteligjencës artificiale kanë zgjedhur një rrugë të ndryshme. Google thuhet se i paguan Reddit 60 milionë dollarë në vit për të dhëna trajnimi dhe partneriteti i ka dhënë Reddit një rritje në dukshmërinë e Kërkimit në Google në muajt e fundit.