Modeli i OpenAI arrin nivelin e medaljes së artë në Olimpiadën e Matematikës

OpenAI tha se modeli i saj i papublikuar i inteligjencës artificiale fitoi Olimpiadën Ndërkombëtare të Matematikës të këtij viti pa qasje në internet apo mjete të jashtme. Supozohet se mori një rezultat mjaftueshëm të lartë për të fituar një medalje ari.

Vlera e IA-së për shumicën e përdoruesve sot qëndron në aftësinë e saj për të gjeneruar gjuhë koherente dhe bisedore duke zbatuar teorinë e probabilitetit në grupe të dhënash masive. Megjithatë, një e ardhme ku modelet e IA-së nxisin përparime në fusha si kriptografia dhe eksplorimi i hapësirës duke zgjidhur probleme matematikore komplekse me shumë hapa, tani është një hap më afër realitetit.

OpenAI njoftoi të shtunën, më 19 korrik, se modeli i saj eksperimental i arsyetimit me anë të inteligjencës artificiale fitoi pikë të mjaftueshme në Olimpiadën Ndërkombëtare të Matematikës (IMO) të këtij viti për të fituar një medalje ari.
I nisur në vitin 1959 në Rumani, IMO konsiderohet gjerësisht si një nga garat më të vështira dhe më prestigjioze të matematikës në botë për nxënësit e shkollave të mesme. Ai mbahet gjatë dy ditëve. Pjesëmarrësit e Olimpiadës japin dy provime, ku pritet që ata të zgjidhin tre probleme matematikore në secilën seancë brenda katër orësh e gjysmë.
OpenAI tha se modeli i saj i papublikuar i inteligjencës artificiale u zhvillua në provimin IMO 2025 në të njëjtat kushte, pa qasje në internet ose mjete të jashtme. Ai lexoi formulimet zyrtare të problemeve matematikore dhe gjeneroi prova në gjuhën natyrore. Modeli zgjidhi pesë nga një total prej gjashtë problemesh, duke arritur një rezultat prej 35/42, sipas Alexander Wei, një anëtar i stafit teknik të OpenAI. Kufiri për një medalje ari në IMO të këtij viti ishte 35 pikë, me secilën pyetje që mbante shtatë pikë.
“Kjo nënvizon se sa shpejt ka përparuar IA në vitet e fundit. Në vitin 2021, këshilltari im i doktoraturës @JacobSteinhardth më parashikoi përparimin e matematikës në IA deri në korrik 2025. Unë parashikova 30% në pikën referuese MATH (dhe mendova se të gjithë të tjerët ishin shumë optimistë). Në vend të kësaj, ne kemi ar sipas mendimit tim”, shkroi Wei në një postim në X.
Kjo nuk është hera e parë që një kompani ka pretenduar se modeli i saj i inteligjencës artificiale mund të përputhet me performancën e fituesve të medaljeve të arta sipas IMO-s. Më herët këtë vit, Google DeepMind prezantoi AlphaGeometry 2, një model i projektuar posaçërisht për të zgjidhur probleme komplekse gjeometrike në një nivel të krahasueshëm me një fitues të medaljeve të arta të Olimpiadës njerëzore.
Megjithatë, performanca e modelit eksperimental të OpenAI shihet si një hap përpara për inteligjencën e përgjithshme, jo vetëm për sistemet e IA-së specifike për detyra. “Ne e arrijmë këtë nivel aftësish jo nëpërmjet metodologjisë së ngushtë dhe specifike për detyra, por duke hapur rrugë të reja në të mësuarit përforcues me qëllim të përgjithshëm dhe shkallëzimin e llogaritjes në kohën e testimit”, tha Wei.
Suksesi i modelit shënon përparim përtej të mësuarit tradicional me përforcime (RL), i cili është një proces i përdorur për të trajnuar modelet e IA-së përmes një sistemi shpërblimesh dhe ndëshkimesh të qarta dhe të verifikueshme. Ai ndoshta demonstron aftësi më fleksibile dhe të përgjithshme për zgjidhjen e problemeve, pasi “mund të krijojë argumente të ndërlikuara dhe të pakundërshtueshme në nivelin e matematikanëve njerëzorë”.
Wei pranoi gjithashtu se “parashtrimet e IMO-s janë prova shumëfaqëshe, të vështira për t’u verifikuar”. Provat matematikore përbëhen nga teorema më të vogla dhe të vogla të quajtura lema. OpenAI tha se provat e gjeneruara nga IA për problemet u vlerësuan në mënyrë të pavarur nga tre ish-fitues të medaljeve të IMO-s, të cilët përfunduan rezultatin e modelit unanimisht.
Megjithatë, Gary Marcus, një profesor në Universitetin e Nju Jorkut (NYU) dhe kritik i njohur i reklamimit të inteligjencës artificiale, theksoi se rezultatet ende nuk janë verifikuar në mënyrë të pavarur nga asnjë prej koordinatorëve zyrtarë të IMO 2025. Modeli i inteligjencës artificiale i Google DeepMind thuhet gjithashtu se ka arritur performancën e medaljes së artë në konkursin e matematikës, megjithëse ende nuk ka pasur një njoftim zyrtar nga gjigandi i teknologjisë.
Pretendimet e OpenAI vijnë muaj pasi Agjencia e Projekteve të Kërkimit të Avancuar të Mbrojtjes së SHBA-së (DARPA) nisi një iniciativë të re që synon të angazhojë studiuesit për të gjetur mënyra për të kryer kërkime të nivelit të lartë në matematikë me një “bashkautor” të IA-së. Në të kaluarën, DARPA ishte përgjegjëse për nxitjen e kërkimeve që çuan në krijimin e ARPANET, pararendësit të internetit.
Një model i inteligjencës artificiale që mund të kontrollojë me besueshmëri provat do t’u kursente sasi të mëdha kohe matematikanëve dhe do t’i ndihmonte ata të ishin më kreativë. Ndërsa disa nga këto modele mund të duken të pajisura për të zgjidhur probleme komplekse, ato gjithashtu mund të jenë të prirura të pengohen në pyetje të thjeshta si nëse 9.11 është më i madh se 9.9. Kjo quhet ‘inteligjencë e dhëmbëzuar’ , një term i shpikur nga Andrej Karpathy, një shkencëtar kërkimor i inteligjencës artificiale dhe anëtar themelues i OpenAI.
Duke reaguar ndaj rezultatit IMO të modelit, CEO i OpenAI, Sam Altman, tha: “Ky është një LLM që merret me matematikë dhe jo një sistem specifik formal matematikor; është pjesë e shtytjes sonë kryesore drejt inteligjencës së përgjithshme.”
Megjithatë, krijuesi i ChatGPT nuk planifikon ta publikojë modelin eksperimental të kërkimit të paktën për disa muajt e ardhshëm, pavarësisht aftësive të tij të përparuara matematikore.