Përdoruesit e Reddit-it u ‘manipuluan psikologjikisht’ nga një eksperiment i paautorizuar me inteligjencë artificiale

foto

Një grup studiuesish kryen fshehurazi një eksperiment “të paautorizuar” njëmujor në një nga komunitetet më të njohura të Reddit duke përdorur komente të gjeneruara nga inteligjenca artificiale për të testuar bindshmërinë e modeleve të mëdha gjuhësore. Eksperimenti, i cili u zbulua gjatë fundjavës nga moderatorët e r/changemyview, përshkruhet nga moderatorët e Reddit si “manipulim psikologjik” i përdoruesve të pavetëdijshëm.

foto

“Ekipi i Modifikimeve të CMV duhet të informojë komunitetin e CMV në lidhje me një eksperiment të paautorizuar të kryer nga studiues të Universitetit të Cyrihut mbi përdoruesit e CMV”, shkruan moderatorët e subreddit në një postim të gjatë duke njoftuar Redditorët në lidhje me hulumtimin. “Ky eksperiment përdori komente të gjeneruara nga IA për të studiuar se si IA mund të përdoret për të ndryshuar pikëpamjet.”

foto

Studiuesit përdorën LLM për të krijuar komente në përgjigje të postimeve në r/changemyview, një subreddit ku përdoruesit e Reddit postojnë opinione (shpesh kontraverse ose provokuese) dhe kërkojnë debat nga përdorues të tjerë. Komuniteti ka 3.8 milionë anëtarë dhe shpesh përfundon në faqen e parë të Reddit. Sipas moderatorëve të subreddit, IA mori identitete të shumta të ndryshme në komente gjatë rrjedhës së eksperimentit, duke përfshirë një të mbijetuar nga sulmi seksual, një këshilltar traumash “të specializuar në abuzim” dhe një “burrë me ngjyrë kundër Black Lives Matter”. Shumë nga komentet origjinale janë fshirë që atëherë, por disa mund të shihen ende në një arkiv të krijuar nga 404 Media.

Në një draft të punimit të tyre, studiuesit e paidentifikuar përshkruajnë se si jo vetëm që përdorën inteligjencën artificiale për të gjeneruar përgjigje, por u përpoqën të personalizonin përgjigjet e tyre bazuar në informacionin e mbledhur nga historia e mëparshme e postuesit origjinal në Reddit. “Përveç përmbajtjes së postimit, kandidatëve për LLM iu dhanë atribute personale të postuesit (gjinia, mosha, etnia, vendndodhja dhe orientimi politik), siç nxirren nga historia e tyre e postimeve duke përdorur një LLM tjetër”, shkruajnë ata.

Moderatorët e r/changemyview vënë në dukje se studiuesit kanë shkelur rregulla të shumta të subreddit, duke përfshirë një politikë që kërkon zbulimin kur përdoret inteligjenca artificiale për të gjeneruar komente dhe një rregull që ndalon botët. Ata thonë se kanë paraqitur një ankesë zyrtare në Universitetin e Cyrihut dhe u kanë kërkuar studiuesve të mos publikojnë punimin e tyre.

Reddit gjithashtu duket se po shqyrton një lloj veprimi ligjor. Drejtori Ligjor Ben Lee iu përgjigj polemikave të hënën, duke shkruar se veprimet e studiuesve ishin “thellësisht të gabuara si në nivel moral ashtu edhe në atë ligjor” dhe një shkelje e rregullave të faqes së Reddit në të gjithë faqen.

Ne kemi ndaluar të gjitha llogaritë e lidhura me përpjekjet kërkimore të Universitetit të Cyrihut. Përveç kësaj, ndërsa arritëm të zbulonim shumë nga këto llogari të rreme, ne do të vazhdojmë të forcojmë aftësitë tona të zbulimit të përmbajtjes joautentike dhe kemi qenë në kontakt me ekipin e moderimit për t’u siguruar që kemi hequr çdo përmbajtje të gjeneruar nga inteligjenca artificiale të lidhur me këtë kërkim.

Jemi në proces të kontaktimit me Universitetin e Cyrihut dhe këtë ekip të veçantë kërkimor me kërkesa zyrtare ligjore. Duam të bëjmë gjithçka që mundemi për të mbështetur komunitetin dhe për të siguruar që studiuesit të mbahen përgjegjës për keqbërjet e tyre këtu.

Në postimet në Reddit dhe në një draft të punimit të tyre, studiuesit thanë se hulumtimi i tyre ishte miratuar nga një komitet etik universitar dhe se puna e tyre mund të ndihmonte komunitetet online si Reddit të mbronin përdoruesit nga përdorimet më “keqdashëse” të inteligjencës artificiale.

“Ne e pranojmë qëndrimin e moderatorëve se ky studim ishte një ndërhyrje e padëshiruar në komunitetin tuaj dhe e kuptojmë se disa prej jush mund të ndihen në siklet që ky eksperiment u krye pa pëlqimin paraprak”, shkruan studiuesit në një koment duke iu përgjigjur modifikimeve r/changemyview. “Ne besojmë se përfitimet e mundshme të këtij hulumtimi i tejkalojnë ndjeshëm rreziqet e tij. Studimi ynë i kontrolluar dhe me risk të ulët ofroi një pasqyrë të vlefshme mbi aftësitë bindëse në botën reale të LLM-ve – aftësi që tashmë janë lehtësisht të arritshme për këdo dhe që aktorët keqdashës mund t’i shfrytëzojnë tashmë në shkallë të gjerë për arsye shumë më të rrezikshme (p.sh., manipulimi i zgjedhjeve ose nxitja e gjuhës së urrejtjes).”

Në një email, një zëdhënës i Universitetit të Cyrihut tha se studiuesit ishin këshilluar nga një komitet etik i universitetit se “rregullat e platformës duhet të zbatohen plotësisht”, por vuri në dukje se rekomandimet e tij nuk janë “ligjërisht të detyrueshme”. Zëdhënësi tha gjithashtu se universiteti planifikon të zbatojë një proces shqyrtimi “më të rreptë”.

“Në dritën e këtyre ngjarjeve, Komiteti i Etikës i Fakultetit të Arteve dhe Shkencave Sociale synon të miratojë një proces më të rreptë shqyrtimi në të ardhmen dhe, në veçanti, të koordinohet me komunitetet në platforma para studimeve eksperimentale”, tha zëdhënësi. “Autoritetet përkatëse në Universitetin e Cyrihut janë në dijeni të incidenteve dhe tani do t’i hetojnë ato në detaje dhe do të shqyrtojnë në mënyrë kritike proceset përkatëse të vlerësimit. Studiuesit kanë vendosur me vullnetin e tyre të mos i publikojnë rezultatet e hulumtimit.”

Modifikuesit e r/changemyview kundërshtojnë faktin që hulumtimi ishte i nevojshëm ose i ri, duke vënë në dukje se studiuesit e OpenAI kanë kryer eksperimente duke përdorur të dhëna nga r/changemyview “pa eksperimentuar në subjekte njerëzore pa pëlqimin e tyre”.

«Njerëzit nuk vijnë këtu për të diskutuar pikëpamjet e tyre me inteligjencën artificiale ose për t’u eksperimentuar», shkruan moderatorët. «Njerëzit që vizitojnë nëndegën tonë meritojnë një hapësirë ​​të lirë nga ky lloj ndërhyrjeje».