OpenAI lançoi një dyshe modelesh AI për arsyetim, o3 dhe o4-mini

OpenAI njoftoi të mërkurën lançimin e o3 dhe o4-mini, modele të reja të arsyetimit të AI të krijuara për të ndalur dhe për të punuar me pyetjet përpara se të përgjigjen.

Kompania e quan o3 modelin e saj më të avancuar të arsyetimit ndonjëherë, duke tejkaluar modelet e mëparshme të kompanisë në testet që matin aftësitë e matematikës, kodimit, arsyetimit, shkencës dhe të kuptuarit vizual. Ndërkohë, o4-mini ofron atë që OpenAI thotë se është një shkëmbim konkurrues midis çmimit, shpejtësisë dhe performancës – tre faktorë që zhvilluesit shpesh i marrin parasysh kur zgjedhin një model AI për të fuqizuar aplikacionet e tyre.

Ndryshe nga modelet e mëparshme të arsyetimit, o3 dhe o4-mini mund të gjenerojnë përgjigje duke përdorur mjete në ChatGPT si shfletimi në ueb, ekzekutimi i kodit Python, përpunimi i imazhit dhe gjenerimi i imazheve. Duke filluar nga sot, modelet, plus një variant i o4-mini i quajtur “o4-mini-high” që shpenzon më shumë kohë duke krijuar përgjigje për të përmirësuar besueshmërinë e tij, janë të disponueshme për abonentët në planet Pro, Plus dhe Team të OpenAI.
Modelet e reja janë pjesë e përpjekjes së OpenAI për të mposhtur Google, Meta, xAI, Anthropic dhe DeepSeek në garën globale të AI. Ndërsa OpenAI ishte i pari që lëshoi një model arsyetimi të AI, o1, konkurrentët ndoqën shpejt me versionet e tyre që përputhen ose tejkalojnë performancën e linjës së OpenAI. Në fakt, modelet e arsyetimit kanë filluar të dominojnë fushën pasi laboratorët e inteligjencës artificiale synojnë të kërkojnë më shumë performancë nga sistemet e tyre.
O3 pothuajse nuk u lëshua në ChatGPT. CEO i OpenAI Sam Altman sinjalizoi në shkurt se kompania synonte t’i kushtonte më shumë burime një alternative të sofistikuar që përfshinte teknologjinë e o3. Por presioni konkurrues në dukje e nxiti OpenAI të kthente kursin në fund.
OpenAI thotë se o3 arrin performancën më të fundit në stolin SWE të verifikuar (pa skela me porosi), një test që mat aftësitë e kodimit, duke shënuar 69.1%. Modeli o4-mini arrin performancë të ngjashme, duke shënuar 68.1%. Modeli tjetër më i mirë i OpenAI, o3-mini, shënoi 49.3% në test, ndërsa Claude 3.7 Sonnet shënoi 62.3%.
OpenAI pretendon se o3 dhe o4-mini janë modelet e saj të para që mund të “mendojnë me imazhe”. Në praktikë, përdoruesit mund të ngarkojnë imazhe në ChatGPT, të tilla si skica të tabelës së bardhë ose diagrame nga PDF, dhe modelet do t’i analizojnë imazhet gjatë fazës së tyre të “zinxhirit të mendimit” përpara se të përgjigjen. Falë kësaj aftësie të sapogjetur, o3 dhe o4-mini mund të kuptojnë imazhe të paqarta dhe me cilësi të ulët dhe mund të kryejnë detyra të tilla si zmadhimi ose rrotullimi i imazheve siç arsyetojnë.
Përtej aftësive të përpunimit të imazhit, o3 dhe o4-mini mund të ekzekutojnë dhe ekzekutojnë kodin Python direkt në shfletuesin tuaj nëpërmjet veçorisë Canvas të ChatGPT dhe të kërkojnë në ueb kur pyeten për ngjarjet aktuale.
Përveç ChatGPT, të tre modelet – o3, o4-mini dhe o4-mini-high – do të jenë të disponueshme përmes pikave përfundimtare të OpenAI-t që përballen me zhvilluesit, API-së së Përfundimeve të Chat dhe API-së së Përgjigjeve, duke lejuar inxhinierët të ndërtojnë aplikacione me modelet e kompanisë me tarifa të bazuara në përdorim.
OpenAI po u ngarkon zhvilluesve një çmim relativisht të ulët për o3, duke pasur parasysh performancën e tij të përmirësuar, me 10 dollarë për milion argumente hyrëse (afërsisht 750,000 fjalë, më të gjata se seria Lord of the Rings) dhe 40 dollarë për milion argumente dalëse. Për o4-mini, OpenAI po tarifon njësoj si o3-mini, 1,10 dollarë për milion shenja hyrëse dhe 4,40 dollarë për milion argumente dalëse.
Në javët e ardhshme, OpenAI thotë se planifikon të lëshojë o3-pro, një version i o3 që përdor më shumë burime kompjuterike për të prodhuar përgjigjet e tij, ekskluzivisht për abonentët ChatGPT Pro.
Shefi ekzekutiv i OpenAI, Sam Altman ka treguar se o3 dhe o4-mini mund të jenë modelet e fundit të arsyetimit të pavarur të AI në ChatGPT përpara GPT-5, një model që kompania ka thënë se do të unifikojë modelet tradicionale si GPT-4.1 me modelet e saj të arsyetimit.