Një burrë i rraskapitur mposht modelin e inteligjencës artificiale në kampionatin botëror të programimit

foto

Një programues polak që punonte me gaz arriti së fundmi atë që së shpejti mund të bëhet e pamundur: duke mposhtur një model të përparuar të inteligjencës artificiale nga OpenAI në një garë kodimi kokë më kokë. Maratona 10-orëshe e la atë “plotësisht të rraskapitur”.

foto

Të mërkurën, programuesi Przemysław Dębiak (i njohur si “Psyho”), një ish-punonjës i OpenAI, e mundi me një diferencë të ngushtë modelin e personalizuar të IA-së në konkursin AtCoder World Tour Finals 2025 Heuristic në Tokio. AtCoder, një platformë japoneze që organizon konkurse programimi konkurruese dhe mirëmban renditje globale, mbajti atë që mund të jetë konkursi i parë ku një model i IA-së garoi drejtpërdrejt kundër programuesve më të mirë njerëzorë në një kampionat të madh botëror në vend. Gjatë eventit, krijuesi i ChatGPT mori pjesë si sponsor dhe paraqiti një model të IA-së në një ndeshje të veçantë ekspozite të titulluar “Njerëzit kundër IA-së”. Pavarësisht natyrës së palodhur të silikonit, kompania zuri vendin e dytë.

“Njerëzimi ka triumfuar (për momentin!),” shkroi Dębiak në X, duke vënë në dukje se kishte fjetur pak ndërsa garonte në disa gara gjatë tre ditëve. “Jam plotësisht i rraskapitur. … Mezi jam gjallë.”

Konkursi kërkonte që pjesëmarrësit të zgjidhnin një problem të vetëm kompleks optimizimi gjatë 600 minutave. Konkursi i bën jehonë përrallës popullore amerikane të John Henry-t, njeriut që drejtonte çelik, i cili garoi kundër një makine shpimi me avull në vitet 1870. Ashtu si beteja legjendare e Henry-t kundër automatizimit industrial, fitorja e Dębiak përfaqëson një ekspert njerëzor që e shtyn veten deri në kufijtë e tij fizikë për të provuar se aftësitë njerëzore ende kanë rëndësi në një epokë të përparimit të inteligjencës artificiale.

Të dyja historitë paraqesin gara të lodhshme qëndrueshmërie—Henry ngiste thumba çeliku për orë të tëra derisa zemra i pushoi, ndërsa Dębiak kodoi për 10 orë me gjumë minimal. Paralelja shtrihet deri te natyra e hidhur e të dy fitoreve: Henry fitoi garën e tij, por vdiq nga kjo përpjekje, duke simbolizuar marshimin e pashmangshëm të automatizimit, ndërsa pranimi i Dębiak se njerëzimi mbizotëroi “për momentin” sugjeron që ai e njeh që ky mund të jetë një triumf i përkohshëm kundër makinave gjithnjë e më të afta.

Ndërsa Dębiak fitoi 500,000 jen dhe i mbijetoi kësaj prove më mirë se piloti legjendar i çelikut, Finalet e Turneut Botëror AtCoder i shtyjnë njerëzit dhe modelet e inteligjencës artificiale në kufijtë e tyre përmes sfidave komplekse të optimizimit që nuk kanë zgjidhje të përsosura – vetëm zgjidhje gjithnjë e më të mira.

Finalet e Turneut Botëror AtCoder përfaqësojnë një nga ngjarjet më ekskluzive të programimit konkurrues, duke ftuar vetëm 12 programuesit më të mirë në mbarë botën bazuar në performancën e tyre gjatë vitit të kaluar. Divizioni Heuristik përqendrohet në problemet e optimizimit ” të vështira për t’u përdorur nga NP “. Në programim, heuristikat janë teknika të zgjidhjes së problemeve që gjejnë zgjidhje mjaft të mira përmes rrugëve të shkurtra dhe hamendësimeve të informuara kur përgjigjet perfekte do të merrnin shumë kohë për t’u llogaritur.

Të gjithë konkurrentët, përfshirë OpenAI, ishin të kufizuar në përdorimin e pajisjeve identike të ofruara nga AtCoder, duke siguruar një fushë loje të barabartë midis konkurrentëve njerëzorë dhe atyre të IA-së. Sipas rregullave të konkursit, pjesëmarrësit mund të përdornin çdo gjuhë programimi të disponueshme në AtCoder, pa penalizim për ridërgim, por me një pritje të detyrueshme pesë-minutëshe midis dorëzimeve.

foto

Rezultatet përfundimtare të konkursit treguan se Psyho përfundoi me një rezultat prej 1,812,272,558,909 pikësh, ndërsa modeli i OpenAI (i listuar si “OpenAIAHC”) shënoi 1,654,675,725,406 pikë – një diferencë prej afërsisht 9.5 përqind. Pjesëmarrësi artificial i OpenAI, një model arsyetimi i simuluar i personalizuar i ngjashëm me o3, u rendit i dyti në përgjithësi, përpara 10 programuesve të tjerë njerëzorë që ishin kualifikuar përmes renditjeve njëvjeçare.

OpenAI e karakterizoi vendin e dytë si një moment historik për modelet e IA-së në programimin konkurrues. “Modele si o3 renditen midis 100 më të mirëve në garat e kodimit/matematikës, por për aq sa dimë ne, ky është vendosja e parë midis 3 më të mirëve në një garë kryesore kodimi/matematike”, tha një zëdhënës i kompanisë në një email drejtuar Ars Technica. “Ngjarjet si AtCoder na japin një mënyrë për të testuar se sa mirë modelet tona mund të arsyetojnë strategjikisht, të planifikojnë në horizonte të gjata kohore dhe të përmirësojnë zgjidhjet përmes provës dhe gabimit – ashtu siç do të bënte një njeri.”

Ndërsa vlerësimi i OpenAI për implikimet e rezultateve të konkursit mund të duket optimist i gjerë, nuk ka dyshim se shumë modele të IA-së janë përmirësuar ndjeshëm në përfundimin e detyrave të kodimit gjatë viteve të fundit. Për shembull, Raporti i Indeksit të IA-së 2025 i Universitetit Stanford tregoi se në SWE-bench , një pikë referimi e projektuar për të matur aftësinë e kodimit, “sistemet e IA-së mund të zgjidhnin vetëm 4.4% të problemeve të kodimit në vitin 2023 – një shifër që u rrit në 71.7% në vitin 2024”.

Kodimi është një nga përdorimet më të shpeshta të chatbot-eve nga OpenAI, Anthropic, Google dhe Meta, dhe mjete të tilla si GitHub Copilot dhe Cursor janë bërë mjete standarde për shumë zhvillues profesionistë, me një anketë të GitHub të vitit 2024 që tregon se mbi 90 përqind e zhvilluesve tani përdorin mjete kodimi të IA-së në rrjedhën e tyre të punës, megjithëse një studim i kohëve të fundit sugjeroi që ndihma e IA-së mund të mos i kursejë zhvilluesve aq kohë sa mendojnë ata.

Megjithatë, ndërsa modelet e inteligjencës artificiale vazhdojnë të bëhen më të afta në detyra si kodimi, fitorja e Dębiak ndihet më pak si një triumf i përhershëm dhe më shumë si një pikë e rëndësishme e të dhënave në një trajektore më të gjatë. Ndryshe nga fitorja fatale e Henry-t, ky programues jetoi për të koduar një ditë tjetër, megjithëse herën tjetër mund ta gjejë veten duke garuar kundër një makine edhe më të shpejtë.

“Sinqerisht, gjithë kjo entuziazëm duket paksa e çuditshme”, tha Dębiak në X. “Nuk e prisja kurrë që kaq shumë njerëz do të ishin të interesuar në konkurset e programimit.”

Për momentin, aftësia njerëzore për të gjetur qasje të papritura mbetet unike. Por, ndërsa OpenAI dhe kompani të tjera vazhdojnë të përsosin modelet e tyre, konkurrentët e ardhshëm të AtCoder mund ta gjejnë veten duke konkurruar më pak kundër IA-së dhe më shumë përkrah saj – ose aspak.