Shkencëtarët përdorin AI për të deshifruar fjalët dhe fjalitë nga skanimet e trurit
Një teknikë e bazuar në inteligjencën artificiale (AI) mund të përkthejë skanimet e trurit në fjalë dhe fjali, raporton një ekip neuroshkencëtarësh kompjuterikë. Megjithëse në fazat e hershme dhe larg të qenit perfekt, teknologjia e re mund të ndihmojë përfundimisht individët me lëndime të trurit ose paralizë të rifitojnë aftësinë për të komunikuar, thonë studiuesit.
Studimi “tregon se, duke përdorur metodat e duhura dhe modelet më të mira, ne mund të deshifrojmë atë që subjekti po mendon”, thotë Martin Schrimpf, një neuroshkencëtar kompjuterik në Institutin e Teknologjisë në Massachusetts, i cili nuk ishte i përfshirë në punë.
Ekipe të tjera kërkimore kanë krijuar ndërfaqe tru-kompjuter (BCI) për të përkthyer, për shembull, aktivitetin e trurit të një pacienti të paralizuar me fjalë. Megjithatë, shumica e këtyre qasjeve mbështeten në elektroda të implantuara në trurin e pacientit. Teknikat joinvazive të bazuara në metoda të tilla si elektroencefalogrami (EEG), i cili mat aktivitetin e trurit nëpërmjet elektrodave të ngjitura në lëkurën e kokës, kanë ecur më pak mirë. BCI-të e bazuara në EEG deri më tani kanë qenë në gjendje të deshifrojnë vetëm frazat dhe nuk mund të rindërtojnë gjuhën koherente, thotë Schrimpf. BCI-të e mëparshme gjithashtu zakonisht fokusoheshin te individët që përpiqeshin të flisnin ose mendonin për të folur, kështu që ata mbështeteshin në zonat e trurit të përfshira në prodhimin e lëvizjeve të lidhura me të folurin dhe funksiononin vetëm kur një person lëvizte ose përpiqej të lëvizte.
Tani, Alexander Huth, një neuroshkencëtar kompjuterik në Universitetin e Teksasit në Austin, dhe kolegët kanë zhvilluar një BCI të bazuar në imazhet funksionale të rezonancës magnetike (fMRI) që prek më drejtpërdrejt zonat e trurit që prodhojnë gjuhën për të deshifruar fjalimin e imagjinuar. Kjo metodë joinvazive, e përdorur zakonisht në kërkimet e neuroshkencës, gjurmon ndryshimet në rrjedhën e gjakut brenda trurit për të matur aktivitetin nervor.
Ashtu si me të gjitha BCI-të, qëllimi ishte të lidhej çdo fjalë, frazë ose fjali me modelin e veçantë të aktivitetit të trurit që ngjall. Për të mbledhur të dhënat e nevojshme, studiuesit skanuan trurin e tre pjesëmarrësve, ndërsa secili dëgjonte afërsisht 16 orë podkaste tregimi, si The Moth Radio Hour dhe The New York Times’s Modern Love. Me këto të dhëna, studiuesit prodhuan një grup hartash për çdo subjekt që specifikonte se si reagon truri i personit kur dëgjon një fjalë, frazë ose kuptim të caktuar. Për shkak se fMRI merr disa sekonda për të regjistruar aktivitetin e trurit, ajo kap jo çdo fjalë specifike, por më tepër idenë e përgjithshme me çdo frazë dhe fjali, thotë Huth. Ekipi i tij përdori të dhënat fMRI për të trajnuar AI për të parashikuar se si truri i një individi të caktuar do të reagonte ndaj gjuhës.
Fillimisht, sistemi u përpoq të kthente skanimet e trurit në gjuhë. Por më pas studiuesit inkorporuan edhe modelin e gjuhës natyrore GPT për të parashikuar se cila fjalë mund të vijë pas tjetrës. Duke përdorur hartat e krijuara nga skanimet dhe modeli gjuhësor, ata kaluan nëpër fraza dhe fjali të ndryshme të mundshme për të parë nëse aktiviteti i parashikuar i trurit përputhej me aktivitetin aktual të trurit. Nëse ndodhi, ata e mbanin atë frazë dhe vazhduan te fraza tjetër.
Më pas, subjektet dëgjuan podkaste që nuk ishin përdorur në trajnim. Dhe pak nga pak, sistemi prodhoi fjalë, fraza dhe fjali, duke prodhuar përfundimisht ide që përputheshin saktësisht me atë që po dëgjonte personi. Teknologjia ishte veçanërisht e mirë për të kuptuar thelbin e tregimit, edhe nëse nuk e kuptonte gjithmonë çdo fjalë të drejtë.
Gjithashtu funksiononte kur një subjekt tregoi një histori ose pa një video. Në një eksperiment, pjesëmarrësit panë një film pa zë, ndërsa sistemi u përpoq të dekodonte atë që ata po mendonin. Ndërsa një individ shikonte një film të animuar ku një dragua godet dikë, sistemi bërtiti: “Ai më rrëzon në tokë”. E gjithë kjo ndodhi pa u kërkuar pjesëmarrësve të flasin. “Kjo vërtet tregon se ajo që po arrijmë këtu është diçka më e thellë se thjesht gjuhë,” thotë Huth. “[Sistemi] funksionon në nivelin e ideve.”
Sistemi mund të ndihmojë një ditë individët që kanë humbur aftësinë e tyre për të komunikuar për shkak të dëmtimit të trurit, goditjes në tru ose sindromës së bllokimit, një lloj paralize në të cilën individët janë të vetëdijshëm, por të paralizuar. Megjithatë, kjo do të kërkojë jo vetëm avancimin e teknologjisë duke përdorur më shumë të dhëna trajnimi, por edhe duke e bërë atë më të aksesueshme. Të qenit i bazuar në fMRI e bën sistemin të shtrenjtë dhe të rëndë për t’u përdorur, por Huth thotë se qëllimi i ekipit është që të jetë në gjendje ta bëjë këtë me teknika imazherike më të lehta dhe më portative si EEG.
Edhe pse nuk është afër të jesh në gjendje të deshifrosh mendimet spontane në botën reale, përparimi ngre shqetësime se, me përmirësim, teknologjia mund të imitojë një lloj leximi të mendjes. “Mendimi ynë kur e kishim në të vërtetë këtë punë ishte: “O Zot, kjo është disi e frikshme”, kujton Huth. Për të filluar të adresojnë këto shqetësime, autorët testuan nëse një dekoder i trajnuar në një individ do të funksiononte në një tjetër – nuk ndodhi. Pëlqimi dhe bashkëpunimi gjithashtu dukej të ishin kritike, sepse nëse individët rezistonin, duke kryer një detyrë të tillë si numërimi në vend që t’i kushtonin vëmendje podcast-it, sistemi nuk mund të dekodonte asnjë kuptim nga aktiviteti i tyre i trurit.
Megjithatë, privatësia është ende një shqetësim i madh etik për këtë lloj neuroteknologjie, thotë Nita Farahany, një bioetike në Universitetin Duke. Studiuesit duhet të shqyrtojnë implikimet e punës së tyre dhe të zhvillojnë masa mbrojtëse kundër keqpërdorimit që herët. “Ne kemi nevojë që të gjithë të marrin pjesë në sigurimin që kjo të ndodhë në mënyrë etike,” thotë ajo. “[Teknologjia] mund të jetë vërtet transformuese për njerëzit që kanë nevojë për aftësinë për të qenë në gjendje të komunikojnë përsëri, por implikimet për ne të tjerët janë të thella.”