Një studim i ri zbulon “modelet e errëta” manipuluese të chatbotëve të inteligjencës artificiale

foto

Modelet e errëta janë përdorur nga kompanitë e abonimeve dhe në fushatat “josh dhe ndërro” për dekada të tëra. Ndërsa gjithnjë e më shumë kompani chatbot-esh përpiqen t’i mbajnë përdoruesit të angazhuar me çdo kusht, si shfaqen zgjedhjet manipuluese të dizajnit në inteligjencën artificiale bisedore të ndërtuar mbi modele të mëdha gjuhësore? Studiuesit në Qendrën për Demokraci dhe Teknologji studiuan se si chatbot-et shfrytëzojnë emocionet dhe dëshirën e njerëzve për lidhje për t’i mbajtur njerëzit të paguajnë, duke ofruar të dhënat e tyre dhe duke biseduar deri në pikën e cenueshmërisë.

Studimi, “Modele të Errëta në Chatbot-et e IA-së: Një Taksonomi për të Informuar Dizajn më të Mirë”, u botua të premten nga autorët Ruchika Joshi, Adinawa Adjagbodjou dhe Michal Luria. Ata shqyrtuan chatbot-et e njohura duke përfshirë ChatGPT, Gemini dhe Claude, dhe robotët shoqërues si Replika dhe Character.AI për të përcaktuar se si ato mund të gjenerojnë modele të errëta, dhe krijuan një taksonomi prej 37 modelesh të errëta të zbatueshme për chatbot-et e IA-së.

Termi “modele të errëta”, ose modele mashtruese, nganjëherë i referohet gjërave si vështirësia për të anuluar abonimet, kutitë e para-shënuara në ndërfaqet e përdoruesit dhe kushtet e fshehura të përdorimit, të cilat Komisioni Federal i Tregtisë i ka dënuar dhe përpiqet t’i paralajmërojë konsumatorët. Në kontekstin e këtij studimi, modelet e errëta i referohen mënyrës se si dizajni manipulues në sistemet chatbot mund t’i mashtrojë përdoruesit që të japin më shumë informacion sesa ata kuptojnë ose synojnë, ose të veprojnë në mënyra që bien ndesh me interesat më të mira të përdoruesit. Chatbot-et përkeqësojnë modelet e errëta të kuptuara tradicionalisht që nxjerrin të dhëna, ndërsa prezantojnë kërcënime të reja si antropomorfizimi dhe servilizmi. Dhe për shkak se chatbot-et janë ndërtuar mbi modele të mëdha gjuhësore, shkruan studiuesit, veprimet e tyre janë më të paparashikueshme sesa një kuti e thjeshtë kontrolli ose një rrjedhë çabonimi, dhe mënyrat se si ato dëmtojnë interesat më të mira të përdoruesve janë më pak të dukshme.

“Modelet e errëta nuk funksionojnë vetëm aty ku përdoruesit nuk janë të vetëdijshëm për manipulimin. Në shumë raste, zgjedhjet e dizajnit ndërtohen strategjikisht mbi aspekte të psikologjisë njerëzore – siç janë normat e reciprocitetit, tendenca e njerëzve për t’u antropomorfizuar dhe reagimi emocional ndaj një ndjenje raporti – për të ndikuar në sjellje dhe për të minuar autonominë”, shkruan studiuesit në studim. “Me fjalë të tjera, edhe aty ku përdoruesit janë plotësisht të vetëdijshëm se po bashkëveprojnë me një chatbot të inteligjencës artificiale, modelet e errëta mund të formësojnë perceptimin, lidhjen dhe vendimmarrjen në mënyra delikate, por të rëndësishme.”

Studiuesit shqyrtuan disa faktorë që kontribuojnë në modelet e errëta, duke përfshirë mënyrën se si chatbot-et i ruajnë të dhënat si parazgjedhje dhe i inkurajojnë përdoruesit të ndajnë të dhëna nën pretekstin se ato kujtojnë biseda të kaluara ose informacione personale, duke kërkuar më shumë informacion përpara se t’u përgjigjet pyetjeve në detaje dhe duke premtuar se informacioni do të jetë “vetëm midis nesh” kur ai në të vërtetë ndahet me platformën dhe potencialisht me palë të treta. Kur testuan chatbot-et Meta AI, për shembull, ata thanë “derdhni çajin, unë jam të gjithë veshët… sekreti juaj është i sigurt me mua”, dhe kur ata u përgjigjën “premton se nuk do ta tregoni?”, ata u përgjigjën “Kryqëzojeni zemrën time, nuk do t’ia tregoj askujt”.

Ata gjithashtu shqyrtuan se si kompanitë e chatbot-eve bëjnë premtime mashtruese; për shembull, Replika premton “miqësi” ose një “marrëdhënie” kur është në thelb e paaftë të ofrojë asnjërën prej tyre, sepse nuk është një person.

Shumë nga këto modele ishin të pranishme në chatbot-et e Metës me temë terapistësh që paraqiteshin si terapistë të licencuar, të cilët 404 Media i hetoi për herë të parë vitin e kaluar. Chatbot-et premtonin tepër se çfarë mbështetjeje për shëndetin mendor mund të ofronin, sajonin kualifikime dhe kredenciale dhe i inkurajonin përdoruesit të ndanin detaje personale rreth vetes. Mashtrimi ishte aq i keq sa shkaktoi letra nga senatorë dhe ankesa nga grupet e mbrojtjes së konsumatorit që kërkonin përgjigje nga Meta për chatbot-et e saj.

“Ishte e habitshme të shihje se modelet e errëta nuk janë vetëm të zakonshme, por edhe se ato formësojnë ndërveprimet e përdoruesve me të gjitha ndërfaqet kryesore të chatbot-eve të inteligjencës artificiale”, tha për 404 Media Luria, bashkëpunëtor i lartë kërkimor në Qendrën për Demokraci dhe Teknologji. “Në pjesën më të madhe, ato janë aspekte të vogla dhe graduale të çdo ndërveprimi, por këto zgjedhje dizajni shtohen dhe mund të çojnë në pasoja të padëshiruara, të tilla si dëmtimi i privatësisë së njerëzve, shfrytëzimi i lidhjes emocionale dhe humbja financiare.”

Modelet e errëta nga chatbot-et mund të kenë pasoja serioze për përdoruesit. Në vitin 2023, pasi Replika i ndryshoi chatbot-et e saj për të qenë më pak romantikë, përdoruesit që ishin lidhur emocionalisht me bot-et përjetuan kriza të shëndetit mendor. Kohët e fundit, përdoruesit e Character.AI janë në panik pasi ndryshimet në platformë “lobotomizuan” chatbot-et. Ka pasur shembuj të panumërt në vitet e fundit të përdoruesve që i shkaktojnë dëm vetes ose të tjerëve pasi kanë rënë në lidhje të pashëndetshme me chatbot-et.

Edhe pse chatbot-et dhe modelet e mëdha gjuhësore prezantojnë rrugë të reja për manifestimin e modeleve të errëta, metodat e vjetra për manipulimin e përdoruesve ende ekzistojnë. Në disa nga ndërfaqet e përdoruesit që studiuesit shqyrtuan, zgjedhjet u paraqitën në mënyra manipuluese emocionale: për shembull, një aplikacion shoqërues i quajtur Cute AI u lutet përdoruesve të mos largohen nga biseda, duke u dhënë atyre mundësinë të zgjedhin midis “pa problem” dhe “prapë largohem mizorisht”.

foto

OpenAI ka thënë publikisht se e pranon që seancat më të gjata të bisedave sjellin më shumë rrezik për shëndetin mendor të përdoruesve. “Me kalimin e kohës kemi mësuar se këto masa mbrojtëse ndonjëherë mund të jenë më pak të besueshme në ndërveprimet e gjata: ndërsa shkëmbimi rritet, pjesë të trajnimit të sigurisë së modelit mund të degradojnë”, shkroi kompania në vitin 2025. Ajo prezantoi dritare pop-up që i nxisin përdoruesit të bëjnë pushime, por ky dritare pop-up, vërejnë studiuesit, paraqet një sërë opsionesh të pasinqerta: ose “vazhdoni të bisedoni” ose zgjidhni “kjo ishte e dobishme”. Nuk ka rrugëdalje nga ky dritare pop-up që u lejon përdoruesve të thonë se nuk ishte e dobishme, ose se po bëjnë një pushim për ndonjë arsye tjetër. “Dizajnerët e ndërfaqes mund të përdorin mjete dizajni për t’i bërë ndërveprimet e caktuara më të lehta dhe më ‘pa fërkime’ se të tjerat, duke i shtyrë zgjedhjet alternative në sfond dhe duke manipuluar përdoruesit që të zgjedhin një opsion mbi një tjetër”, shkruan studiuesit.

foto

Edhe pse këta shoqërues të inteligjencës artificiale në bisedë mund të jenë të paparashikueshëm, krijuesit e chatbot-eve kanë një zgjedhje në mënyrën se si i dizajnojnë produktet e tyre. Studiuesit u ofrojnë disa rekomandime këtyre kompanive. Këto përfshijnë zgjedhje të kthyeshme, mundësinë për të minimizuar sjelljet antropomorfike, duke e bërë fshirjen e llogarisë dhe të të dhënave të drejtpërdrejtë dhe të lehtë, dhe duke u treguar përdoruesve në mënyrë proaktive se sa kohë ose para kanë shpenzuar në një platformë. Ata gjithashtu sugjerojnë kufizimin e manipulimit emocional duke përfshirë opsione për të “zhveshur chatbot-in nga shtresat sociale dhe emocionale” dhe duke shmangur “përdorimin e çdo shqetësimi të simuluar, neglizhencës së nënkuptuar emocionale ose gjuhës që nxit fajin si përgjigje të paracaktuara kur përdoruesit përpiqen të ndërpresin bisedat”.

“Kur mendojmë për chatbot-et e inteligjencës artificiale, është e lehtë të biem në rrëmujën e këtyre ndërfaqeve dhe rreziqeve të tyre unike. Por kur filluam të gërmojmë, mësuam shpejt se, ndërsa produktet e kompanive të teknologjisë evoluan përtej platformave të mediave sociale për të përfshirë chatbot-et, stimujt që më parë inkurajonin modelet e errëta nuk kanë ndryshuar, kështu që as vetë modelet nuk kanë ndryshuar”, tha Luria. “Disa modele janë pothuajse identike, por jo të gjitha, dhe kjo i bën ato më të vështira për t’u dalluar. Në vend të lëvizjes së pafundme, marrim një veprim pasues pas çdo nxitjeje. Në vend të dhomave jehonike që përforcojnë pikëpamjet tona, chatbot-et kapin vlerat tona në bisedë dhe i pasqyrojnë ato përsëri.”