Google DeepMind bën histori në fushën e inteligjencës artificiale me fitimin e medaljes së artë në garën më të vështirë matematikore në botë

Google DeepMind njoftoi të hënën se një version i avancuar i modelit të tij të inteligjencës artificiale Gemini ka arritur zyrtarisht performancën e nivelit të medaljes së artë në Olimpiadën Ndërkombëtare të Matematikës, duke zgjidhur pesë nga gjashtë probleme jashtëzakonisht të vështira dhe duke fituar njohjen si sistemi i parë i inteligjencës artificiale që ka marrë vlerësimin zyrtar të nivelit të artë nga organizatorët e konkursit.

Fitorja përparon fushën e arsyetimit të inteligjencës artificiale dhe e vendos Google në avantazh në betejën në rritje midis gjigantëve të teknologjisë që ndërtojnë inteligjencën artificiale të gjeneratës së ardhshme. Më e rëndësishmja, ajo tregon se inteligjenca artificiale tani mund të trajtojë probleme komplekse matematikore duke përdorur kuptimin e gjuhës natyrore në vend që të kërkojë gjuhë programimi të specializuara.

“Rezultatet zyrtare kanë dalë — Gemini arriti nivelin e medaljes së artë në Olimpiadën Ndërkombëtare të Matematikës!”, shkroi Demis Hassabis, CEO i Google DeepMind, në platformën e mediave sociale X të hënën në mëngjes. “Një version i avancuar ishte në gjendje të zgjidhte 5 nga 6 problemet. Progres i jashtëzakonshëm.”
Olimpiada Ndërkombëtare e Matematikës, e mbajtur çdo vit që nga viti 1959, konsiderohet gjerësisht si konkursi më prestigjioz i matematikës në botë për studentët parauniversitarë. Çdo vend pjesëmarrës dërgon gjashtë matematikanë të rinj elitarë për të garuar në zgjidhjen e gjashtë problemeve jashtëzakonisht sfiduese që përfshijnë algjebrën, kombinatorikën, gjeometrinë dhe teorinë e numrave. Vetëm rreth 8% e pjesëmarrësve njerëzorë zakonisht fitojnë medalje ari.
Suksesi i fundit i Google-it e tejkalon shumë performancën e vitit 2024, kur sistemet e kombinuara AlphaProof dhe AlphaGeometry të kompanisë fituan statusin e medaljes së argjendtë duke zgjidhur katër nga gjashtë problemet. Ky sistem i mëparshëm kërkonte që ekspertët njerëzorë të përkthenin së pari problemet e gjuhës natyrore në gjuhë programimi specifike për domenin dhe më pas të interpretonin rezultatet matematikore të inteligjencës artificiale.
Zbulimi i këtij viti erdhi nëpërmjet Gemini Deep Think, një sistem i përmirësuar arsyetimi që përdor atë që studiuesit e quajnë ” të menduarit paralel “. Ndryshe nga modelet tradicionale të inteligjencës artificiale që ndjekin një zinxhir të vetëm arsyetimi, Deep Think eksploron njëkohësisht zgjidhje të shumta të mundshme përpara se të arrijë në një përgjigje përfundimtare.
“Modeli ynë funksionoi plotësisht në gjuhë natyrore, duke prodhuar prova rigoroze matematikore direkt nga përshkrimet zyrtare të problemeve”, shpjegoi Hassabis në një postim pasues në faqen e mediave sociale X, duke theksuar se sistemi e përfundoi punën e tij brenda afatit standard kohor prej 4.5 orësh të konkursit.
Modeli arriti 35 nga 42 pikë të mundshme, duke tejkaluar lehtësisht pragun e medaljes së artë. Sipas Presidentit të IMO-s, Prof. Dr. Gregor Dolinar, zgjidhjet ishin “ të mahnitshme në shumë aspekte ” dhe u gjetën “të qarta, të sakta dhe shumica e tyre të lehta për t’u ndjekur” nga vlerësuesit e garave.
Njoftimi vjen mes tensioneve në rritje në industrinë e IA-së mbi praktikat konkurruese dhe transparencën. Qasja e matur e Google DeepMind për publikimin e rezultateve të saj ka marrë lëvdata nga komuniteti i IA-së, veçanërisht në kontrast me mënyrën se si rivali OpenAI i ka trajtuar arritjet e ngjashme.
“Ne nuk e njoftuam të premten sepse respektuam kërkesën fillestare të Bordit të IMO-s që të gjithë laboratorët e IA-së të ndanin rezultatet e tyre vetëm pasi rezultatet zyrtare të ishin verifikuar nga ekspertë të pavarur dhe studentët të kishin marrë me të drejtë vlerësimin që meritonin”, shkroi Hassabis , duke iu referuar njoftimit të mëparshëm të OpenAI për performancën e vet në olimpiadë.
Përdoruesit e mediave sociale e vunë re menjëherë dallimin. “E shihni? OpenAI e injoroi kërkesën sipas mendimit tim. Turp. Pa klas. Pa mungesë respekti të plotë”, shkroi një përdorues . “Google DeepMind veproi me integritet, në përputhje me njerëzimin.”
Kritikat rrjedhin nga vendimi i OpenAI për të shpallur rezultatet e olimpiadës së vet matematikore pa marrë pjesë në procesin zyrtar të vlerësimit të IMO-s. Në vend të kësaj, OpenAI kishte një panel me ish-pjesëmarrës të IMO-s që vlerësuan performancën e IA-së së saj, një qasje që disa në komunitet e konsiderojnë si të pabesueshme.
“OpenAI është ndoshta kompania më e keqe në planet tani”, shkroi një kritik, ndërsa të tjerë sugjeruan që kompania duhet “t’i marrë gjërat seriozisht” dhe “të jetë më e besueshme”.
Suksesi i Google DeepMind duket se buron nga teknikat e reja të trajnimit që shkojnë përtej qasjeve tradicionale. Ekipi përdori metoda të avancuara të të mësuarit përforcues, të dizajnuara për të shfrytëzuar të dhënat e arsyetimit me shumë hapa, zgjidhjes së problemeve dhe vërtetimit të teoremave. Modelit iu dha gjithashtu qasje në një koleksion të kuruar zgjidhjesh matematikore me cilësi të lartë dhe mori udhëzime specifike për qasjen ndaj problemeve në stilin IMO.
Arritja teknike i bëri përshtypje studiuesve të inteligjencës artificiale, të cilët vunë re implikimet e saj më të gjera. “Jo vetëm zgjidhja e matematikës… por edhe kuptimi i problemeve të përshkruara në gjuhë dhe zbatimi i logjikës abstrakte në raste të reja”, shkroi vëzhguesja e inteligjencës artificiale Elyss Wren. “Kjo nuk është kujtesë e mësuar përmendësh – kjo është njohje emergjente në lëvizje.”
Ethan Mollick, një profesor në Shkollën Wharton i cili studion inteligjencën artificiale, theksoi rëndësinë e përdorimit të një modeli me qëllim të përgjithshëm në vend të mjeteve të specializuara. “Dëshmi në rritje të aftësisë së LLM-ve për të përgjithësuar në zgjidhjen e problemeve të reja”, shkroi ai, duke theksuar se si kjo ndryshon nga qasjet e mëparshme që kërkonin softuer të specializuar matematikor.
Modeli demonstroi një arsyetim veçanërisht mbresëlënës në një problem ku shumë konkurrentë njerëzorë aplikuan koncepte matematikore të nivelit pasuniversitar. Sipas studiuesit të DeepMind, Junehyuk Jung, Gemini “bëri një vëzhgim të shkëlqyer dhe përdori vetëm teorinë elementare të numrave për të krijuar një provë të pavarur”, duke gjetur një zgjidhje më elegante sesa shumë pjesëmarrës njerëzorë.
Ky zbulim i madh vjen në një moment kritik në industrinë e inteligjencës artificiale, ku kompanitë po garojnë për të demonstruar aftësi superiore arsyetimi. Suksesi ka implikime të menjëhershme praktike: Google planifikon të vërë në dispozicion të matematikanëve një version të këtij modeli Deep Think për testim përpara se ta lançojë atë për abonentët e Google AI Ultra, të cilët paguajnë 250 dollarë në muaj për qasje në modelet më të përparuara të inteligjencës artificiale të kompanisë.
Koha nxjerr në pah gjithashtu konkurrencën në rritje midis laboratorëve kryesorë të inteligjencës artificiale. Ndërsa Google festoi qasjen e saj metodike dhe të verifikuar zyrtarisht, polemika rreth njoftimit të OpenAI pasqyron tensione më të gjera në lidhje me transparencën dhe besueshmërinë në zhvillimin e inteligjencës artificiale.
Kjo dinamikë konkurruese shtrihet përtej arsyetimit matematik. Javët e fundit kanë parë kompani të ndryshme të inteligjencës artificiale të njoftojnë aftësi të reja, megjithëse jo të gjitha janë pritur pozitivisht. xAI i Elon Musk lançoi së fundmi Grok 4, të cilin kompania e quajti “IA më e zgjuar në botë”, megjithëse rezultatet e renditjes treguan se ai ishte prapa modeleve nga Google dhe OpenAI. Përveç kësaj, Grok është përballur me kritika për veçoritë kontraverse, duke përfshirë shoqëruesit e seksualizuar të IA-së dhe episodet e gjenerimit të përmbajtjes antisemite.
Fitorja në olimpiadën matematikore shkon përtej të drejtave të mburrjes konkurruese. Performanca e Gemini tregon se sistemet e inteligjencës artificiale tani mund të përputhen me arsyetimin në nivel njerëzor në detyra komplekse që kërkojnë kreativitet, të menduar abstrakt dhe aftësinë për të sintetizuar njohuri në fusha të shumta.
“Ky është një përparim i rëndësishëm krahasuar me rezultatin e jashtëzakonshëm të vitit të kaluar”, vuri në dukje ekipi i DeepMind në njoftimin e tyre teknik. Përparimi nga kërkesa për gjuhë formale të specializuara në funksionimin tërësisht në gjuhë natyrore sugjeron që sistemet e inteligjencës artificiale po bëhen më intuitive dhe të arritshme.
Për bizneset, ky zhvillim sinjalizon se IA së shpejti mund të trajtojë probleme komplekse analitike në industri të ndryshme pa kërkuar programim të specializuar ose ekspertizë në fushë. Aftësia për të arsyetuar përmes sfidave të ndërlikuara duke përdorur gjuhën e përditshme mund të demokratizojë aftësitë e sofistikuara analitike në të gjitha organizatat.
Megjithatë, mbeten pyetje nëse këto aftësi arsyetimi do të përkthehen në mënyrë efektive në sfida më të çrregullta të botës reale. Olimpiada matematikore ofron probleme të përcaktuara mirë me kritere të qarta suksesi – shumë larg vendimeve të paqarta dhe shumëplanëshe që përcaktojnë shumicën e përpjekjeve të biznesit dhe shkencës.
Google DeepMind planifikon të rikthehet në konkursin e vitit të ardhshëm ” në kërkim të një rezultati perfekt “. Kompania beson se sistemet e inteligjencës artificiale që kombinojnë rrjedhshmërinë e gjuhës natyrore me arsyetimin rigoroz “do të bëhen mjete të paçmuara për matematikanët, shkencëtarët, inxhinierët dhe studiuesit, duke na ndihmuar të përparojmë njohuritë njerëzore në rrugën drejt inteligjencës artificiale”.
Por ndoshta detaji më domethënës doli nga vetë konkursi: kur u përball me problemin më të vështirë të konkursit, Gemini filloi nga një hipotezë e gabuar dhe nuk u rikuperua kurrë. Vetëm pesë studentë njerëzorë e zgjidhën atë problem saktë. Në fund, duket se edhe inteligjenca artificiale, fituese e medaljes së artë, ka ende diçka për të mësuar nga matematikanët adoleshentë.