Shkencëtarët zbulojnë rezultate të papritura
Studiuesit në Universitetin e Bonit ekzaminojnë funksionet e brendshme të aplikacioneve të mësimit të makinerive në kërkimin e drogës.
Inteligjenca artificiale (AI) ka përparuar me shpejtësi, por funksionet e saj të brendshme shpesh mbeten të paqarta, të karakterizuara nga një natyrë e “kutisë së zezë” ku procesi i arritjes së përfundimeve nuk është i dukshëm. Megjithatë, një zbulim i rëndësishëm është bërë nga Prof. Dr. Jürgen Bajorath dhe ekipi i tij, ekspertë të kimiformatikës në Universitetin e Bonit . Ata kanë shpikur një teknikë që zbulon mekanizmat operacionalë të sistemeve të caktuara të AI të përdorura në kërkimin farmaceutik.
Çuditërisht, gjetjet e tyre tregojnë se këto modele të AI mbështeten kryesisht në rikujtimin e të dhënave ekzistuese në vend që të mësojnë ndërveprime specifike kimike për parashikimin e efektivitetit të barnave. Rezultatet e tyre janë publikuar së fundmi në Nature Machine Intelligence .
Cila molekulë ilaçi është më efektive? Studiuesit po kërkojnë me ethe për substanca aktive efikase për të luftuar sëmundjet. Këto komponime shpesh futen në proteina, të cilat zakonisht janë enzima ose receptorë që shkaktojnë një zinxhir specifik të veprimeve fiziologjike.
Në disa raste, disa molekula synojnë gjithashtu të bllokojnë reaksionet e padëshiruara në trup – të tilla si një përgjigje e tepruar inflamatore. Duke pasur parasysh bollëkun e komponimeve kimike të disponueshme, në shikim të parë ky hulumtim është si të kërkosh për një gjilpërë në një kashtë. Prandaj, zbulimi i drogës përpiqet të përdorë modele shkencore për të parashikuar se cilat molekula do të ngjiten më mirë në proteinën përkatëse të synuar dhe do të lidhen fort. Këta kandidatë potencialë për ilaçe më pas hetohen më në detaje në studimet eksperimentale.
Që nga avancimi i AI, kërkimi i zbulimit të barnave gjithashtu ka përdorur gjithnjë e më shumë aplikacione të mësimit të makinerive . Një aplikacion i tillë, “Graph neural networks” (GNNs) ofron një nga disa mundësi për aplikacione të tilla. Ato janë përshtatur për të parashikuar, për shembull, sa fort lidhet një molekulë e caktuar me një proteinë të synuar. Për këtë qëllim, modelet GNN trajnohen me grafikë që përfaqësojnë komplekset e formuara midis proteinave dhe komponimeve kimike (ligande).
Grafikët në përgjithësi përbëhen nga nyje që përfaqësojnë objektet dhe skajet që përfaqësojnë marrëdhëniet midis nyjeve. Në paraqitjet grafikore të komplekseve proteinë-ligandë, skajet lidhin vetëm nyjet e proteinave ose ligandit, që përfaqësojnë strukturat e tyre, përkatësisht, ose nyjet proteina dhe ligand, që përfaqësojnë ndërveprime specifike protein-ligand.
“Mënyra sesi GNN-të arrijnë në parashikimet e tyre është si një kuti e zezë në të cilën nuk mund ta shohim,” thotë Prof. Dr. Jürgen Bajorath. Studiuesi i kemoinformatikës nga Instituti LIMES në Universitetin e Bonit, Qendra Ndërkombëtare e Teknologjisë së Informacionit Bonn-Aachen (B-IT) dhe Instituti Lamarr për Mësimin e Makinerisë dhe Inteligjencën Artificiale në Bon, së bashku me kolegët nga Universiteti Sapienza në Romë. ka analizuar në detaje nëse rrjetet nervore grafike mësojnë në të vërtetë ndërveprimet protein-ligandë për të parashikuar se sa fort lidhet një substancë aktive me një proteinë të synuar.
Studiuesit analizuan gjithsej gjashtë arkitektura të ndryshme GNN duke përdorur metodën e tyre të zhvilluar posaçërisht “EdgeSHAPer” dhe një metodologji konceptualisht të ndryshme për krahasim. Këto programe kompjuterike “ekransojnë” nëse GNN-të mësojnë ndërveprimet më të rëndësishme midis një përbërjeje dhe një proteine dhe në këtë mënyrë parashikojnë fuqinë e ligandit, siç synohet dhe parashikohet nga studiuesit – ose nëse AI arrin në parashikimet në mënyra të tjera.
“GNN-të varen shumë nga të dhënat me të cilat janë trajnuar”, thotë autori i parë i studimit, kandidati për doktoraturë Andrea Mastropietro nga Universiteti Sapienza në Romë, i cili kreu një pjesë të kërkimit të doktoraturës në grupin e Prof. Bajorath në Bon.
Shkencëtarët trajnuan gjashtë GNN-të me grafikë të nxjerrë nga strukturat e komplekseve protein-ligandë, për të cilat mënyra e veprimit dhe forca e lidhjes së komponimeve me proteinat e tyre të synuara ishte tashmë e njohur nga eksperimentet. GNN-të e trajnuar më pas u testuan në komplekse të tjera. Analiza e mëvonshme EdgeSHAPer bëri të mundur më pas të kuptohej se si GNN-të gjeneruan parashikime në dukje premtuese.
“Nëse GNN-të bëjnë atë që pritet, ata duhet të mësojnë ndërveprimet midis përbërjes dhe proteinës së synuar dhe parashikimet duhet të përcaktohen duke u dhënë përparësi ndërveprimeve specifike,” shpjegon Prof. Bajorath. Sipas analizave të ekipit hulumtues, megjithatë, gjashtë GNN-të në thelb dështuan ta bëjnë këtë. Shumica e GNN-ve mësuan vetëm disa ndërveprime proteinash-droge dhe u fokusuan kryesisht në ligandët. Bajorath: “Për të parashikuar forcën e lidhjes së një molekule me një proteinë të synuar, modelet kryesisht ‘kujtuan’ molekula kimikisht të ngjashme që hasën gjatë stërvitjes dhe të dhënat e tyre të lidhjes, pavarësisht nga proteina e synuar. Këto ngjashmëri kimike të mësuara më pas përcaktuan në thelb parashikimet.”
Sipas shkencëtarëve, kjo në masë të madhe të kujton “efektin e zgjuar Hans”. Ky efekt i referohet një kali që me sa duket mund të llogaritet. Sa shpesh trokiti Hansi thundrën e tij supozohej të tregonte rezultatin e një llogaritjeje. Sidoqoftë, siç doli më vonë, kali nuk ishte në gjendje të llogariste fare, por nxori rezultatet e pritshme nga nuancat në shprehjet e fytyrës dhe gjestet e shokut të tij.
Çfarë nënkuptojnë këto gjetje për kërkimin e zbulimit të drogës? “Në përgjithësi nuk është e qëndrueshme që GNN-të të mësojnë ndërveprimet kimike midis substancave aktive dhe proteinave,” thotë shkencëtari i kimiformatikës. Parashikimet e tyre janë kryesisht të mbivlerësuara sepse parashikimet me cilësi të barabartë mund të bëhen duke përdorur njohuri kimike dhe metoda më të thjeshta. Megjithatë, hulumtimi ofron gjithashtu mundësi për AI. Dy nga modelet e ekzaminuara nga GNN shfaqën një tendencë të qartë për të mësuar më shumë ndërveprime kur fuqia e komponimeve të testimit u rrit. “Ia vlen të hedhim një vështrim më të afërt këtu,” thotë Bajorath. Ndoshta këto GNN mund të përmirësohen më tej në drejtimin e dëshiruar përmes paraqitjeve të modifikuara dhe teknikave të trajnimit. Megjithatë, supozimi se sasitë fizike mund të mësohen në bazë të grafikëve molekularë në përgjithësi duhet të trajtohet me kujdes. “AI nuk është magji e zezë”, thotë Bajorath.
Në fakt, ai e sheh publikimin e mëparshëm me akses të hapur të EdgeSHAPer dhe mjeteve të tjera analizuese të zhvilluara posaçërisht si qasje premtuese për të hedhur dritë mbi kutinë e zezë të modeleve të AI. Qasja e ekipit të tij aktualisht fokusohet në GNN dhe “modele të reja të gjuhës kimike”.
“Zhvillimi i metodave për shpjegimin e parashikimeve të modeleve komplekse është një fushë e rëndësishme e kërkimit të AI. Ekzistojnë gjithashtu qasje për arkitekturat e tjera të rrjetit, siç janë modelet e gjuhëve që ndihmojnë për të kuptuar më mirë se si mësimi i makinerive arrin në rezultatet e tij, “thotë Bajorath. Ai pret që së shpejti gjëra emocionuese do të ndodhin edhe në fushën e “Inteligjencës artificiale të shpjegueshme” në Institutin Lamarr, ku ai është një PI dhe Kryetar i AI në Shkencat e Jetës.