Adobe përballet me një padi kolektive të propozuar, e akuzuar për keqpërdorimin e veprave të autorëve në trajnimin e AI-së

foto

Ashtu si pothuajse çdo kompani tjetër teknologjike ekzistuese, Adobe është mbështetur shumë në IA gjatë disa viteve të fundit. Firma e softuerëve ka lançuar një numër shërbimesh të ndryshme të IA-së që nga viti 2023, duke përfshirë Firefly – paketën e saj të gjenerimit të medias të mundësuar nga IA. Megjithatë, tani, përqafimi i plotë i teknologjisë nga kompania mund të ketë çuar në probleme, pasi një padi e re pretendon se ka përdorur libra të piratuar për të trajnuar një nga modelet e saj të IA-së.

foto

Një padi kolektive e propozuar e ngritur në emër të Elizabeth Lyon, një autore nga Oregoni, pretendon se Adobe përdori versione pirate të librave të shumtë – përfshirë edhe të sajin – për të trajnuar programin SlimLM të kompanisë.

foto

Adobe e përshkruan SlimLM si një seri të vogël modelesh gjuhësore që mund të “optimizohet për detyrat e ndihmës për dokumente në pajisjet mobile”. Ajo thotë se SlimLM ishte trajnuar paraprakisht në SlimPajama-627B, një “grup të dhënash të deduplikuara, me shumë korpuse, me burim të hapur” të lëshuar nga Cerebras në qershor të vitit 2023. Lyon, e cila ka shkruar një numër udhëzuesish për shkrimin jo-fiktiv, thotë se disa nga veprat e saj ishin përfshirë në një grup të dhënash paraprake që Adobe kishte përdorur.

Padia e Lyon, e cila u raportua fillimisht nga Reuters, thotë se shkrimi i saj ishte përfshirë në një nëngrup të përpunuar të një grupi të dhënash të manipuluar që ishte baza e programit të Adobe: “Grupi i të dhënave SlimPajama u krijua duke kopjuar dhe manipuluar grupin e të dhënave RedPajama (duke përfshirë kopjimin e Books3)”, thuhet në padi. ​​“Kështu, për shkak se është një kopje derivate e grupit të të dhënave RedPajama, SlimPajama përmban grupin e të dhënave Books3, duke përfshirë veprat e mbrojtura me të drejta autori të Paditëses dhe anëtarëve të Klasës.”

“Books3” — një koleksion i madh prej 191,000 librash që janë përdorur për të trajnuar sistemet GenAI — ka qenë një burim i vazhdueshëm problemesh ligjore për komunitetin e teknologjisë. RedPajama është cituar gjithashtu në një numër çështjesh gjyqësore. Në shtator, një padi kundër Apple pretendonte se kompania kishte përdorur materiale të mbrojtura me të drejta autori për të trajnuar modelin e saj të Inteligjencës Apple. Padia përmendi të dhënat dhe akuzoi kompaninë teknologjike për kopjimin e veprave të mbrojtura “pa pëlqim dhe pa kredi ose kompensim”. Në tetor, një padi e ngjashme kundër Salesforce pretendonte gjithashtu se kompania kishte përdorur RedPajama për qëllime trajnimi.

Fatkeqësisht për industrinë e teknologjisë, padi të tilla, deri tani, janë bërë disi të zakonshme. Algoritmet e inteligjencës artificiale trajnohen në grupe të dhënash masive dhe, në disa raste, këto grupe të dhënash dyshohet se kanë përfshirë materiale të piratuara. Në shtator, Anthropic pranoi të paguante 1.5 miliardë dollarë për një numër autorësh që e kishin paditur dhe e kishin akuzuar për përdorimin e versioneve të piratuara të punës së tyre për të trajnuar chatbot-in e saj, Claude. Rasti u konsiderua si një pikë kthese e mundshme në betejat ligjore të vazhdueshme mbi materialin e mbrojtur me të drejta autori në të dhënat e trajnimit të inteligjencës artificiale, të cilat ka shumë.