Pionierët e AI fitojnë Çmimin Turing për punën e tyre në mësimin përforcues

Dy shkencëtarë kompjuterikë pasues kanë fituar çmimin Turing 2024 për punën e tyre në të mësuarit përforcues, një disiplinë në të cilën makinat mësojnë përmes një qasjeje provë-gabim të bazuar në shpërblime që i lejon ata të përshtaten brenda mjediseve të kufizuara ose dinamike.

Andrew G. Barto , profesor emeritus në Universitetin e Massachusetts Amherst; dhe Richard S. Sutton, një profesor në Universitetin e Albertës, zhvilluan algoritme dhe teori kyçe përmes një serie të rëndësishme punimesh duke filluar në vitet 1980. Kjo përfshin punën në një teknikë përforcuese të quajtur të mësuarit e dallimeve kohore; dyshja më vonë botoi një libër akademik të quajtur ” Të mësuarit përforcues: një hyrje “.
Matematicieni i nderuar Alan Turing (foto më lart), pas të cilit është emëruar çmimi Turing, gjithashtu prodhoi një punim në vitet 1950 të quajtur ” Makineria kompjuterike dhe inteligjenca ” që vuri në dyshim nëse kompjuterët mund të mendojnë dhe prekin koncepte të ngjashme rreth të mësuarit nga përvoja.
Vitet e fundit, të mësuarit përforcues ka marrë më shumë vëmendje pasi Google DeepMind përdori teknikën për të ndërtuar një AI që mposhti lojtarët më të mirë në botë AlphaGo. Dhe në muajt e fundit, DeepSeek, fillestari i inteligjencës artificiale kineze, goditi titujt kryesorë për modelin e tij të arsyetimit R1 që ndryshon lojën, i cili mbështetej shumë në të mësuarit përforcues për të krijuar modele themeli më me kosto efektive.

Çmimi Turing, i administruar nga Shoqata për Makineri Kompjuterike (ACM), shpesh është quajtur “Çmimi Nobel për Informatikë”. Megjithatë, vetë çmimi Nobel ka hyrë në fushën e informatikës, veçanërisht rreth AI; Geoff Hinton dhe John Hopfield fituan Çmimin Nobel në Fizikë për punën e tyre në themelimin e AI vitin e kaluar. Kjo u pasua menjëherë pas Demis Hassabis dhe John Jumper të DeepMind, të cilëve iu dha Çmimi Nobel në Kimi për punën e tyre në AlphaFold.
“Fushat e kërkimit që variojnë nga shkenca konjitive dhe psikologjia te neuroshkenca frymëzuan zhvillimin e të mësuarit përforcues, i cili ka hedhur themelet për disa nga përparimet më të rëndësishme në AI dhe na ka dhënë një pasqyrë më të madhe se si funksionon truri,” tha presidenti i ACM, Yannis Ioannidis në një deklaratë për shtyp. “Puna e Barto-s dhe Sutton-it nuk është një hap nga i cili ne kemi lëvizur tani. Të mësuarit përforcues vazhdon të rritet dhe ofron potencial të madh për përparime të mëtejshme në informatikë dhe shumë disiplina të tjera. Është me vend që po i nderojmë me çmimin më prestigjioz në fushën tonë.”
Pionierë të tjerë të shquar të AI që fituan çmimin Turing përfshijnë shkencëtarin kryesor të AI të Meta, Yann LeCun, të cilit iu dha çmimi në vitin 2018 së bashku me Geoff Hinton dhe Yoshua Bengio për punën e tyre në rrjetet e thella nervore.
Barto dhe Sutton do të ndajnë çmimin prej 1 milion dollarësh, i cili u dha me mbështetjen e Google.