OpenAI publikon GPT-5.2 pas alarmit “code red” për kërcënimin nga Google
Të enjten, OpenAI publikoi GPT-5.2, familjen e saj më të re të modeleve të IA-së për ChatGPT, në tre versione të quajtura Instant, Thinking dhe Pro. Publikimi vjen pas memorandumit të brendshëm “kod të kuq” të CEO-së Sam Altman në fillim të këtij muaji, i cili i drejtoi burimet e kompanisë drejt përmirësimit të ChatGPT në përgjigje të presionit konkurrues nga modeli Gemini 3 IA i Google.
“Ne e hartuam versionin 5.2 për të zhbllokuar edhe më shumë vlerë ekonomike për njerëzit”, tha Fidji Simo, drejtori kryesor i produkteve të OpenAI, gjatë një konference për shtyp me gazetarët të enjten. “Është më i mirë në krijimin e spreadsheet-eve, ndërtimin e prezantimeve, shkrimin e kodit, perceptimin e imazheve, kuptimin e kontekstit të gjatë, përdorimin e mjeteve dhe më pas lidhjen e projekteve komplekse me shumë hapa.”
Ashtu si me versionet e mëparshme të GPT-5, tre nivelet e modelit shërbejnë për qëllime të ndryshme: Instant trajton detyra më të shpejta si shkrimi dhe përkthimi; Thinking nxjerr tekst arsyetimi të simuluar në një përpjekje për të trajtuar punë më komplekse si kodimi dhe matematika; dhe Pro nxjerr tekst arsyetimi edhe më të simuluar me qëllim ofrimin e performancës me saktësinë më të lartë për problemet e vështira.

GPT-5.2 përmban një dritare konteksti prej 400,000 tokenësh, duke i lejuar asaj të përpunojë qindra dokumente njëkohësisht, dhe një datë kufizimi të njohurive më 31 gusht 2025.
GPT-5.2 do të jetë i disponueshëm për abonentët me pagesë të ChatGPT duke filluar nga e enjtja, me aksesin në API të disponueshëm për zhvilluesit. Çmimi në API është 1.75 dollarë për milion tokena hyrës për modelin standard, një rritje prej 40 përqind krahasuar me GPT-5.1. OpenAI thotë se GPT-5.1 më i vjetër do të mbetet i disponueshëm në ChatGPT për përdoruesit me pagesë për tre muaj në një listë zbritëse të modeleve të trashëguara.
Publikimi vjen pas një muaji të vështirë për OpenAI. Në fillim të dhjetorit, Altman lëshoi një direktivë të brendshme “kodi i kuq” pasi modeli Gemini 3 i Google-it kaloi shumë teste të inteligjencës artificiale dhe fitoi pjesë të tregut. Memorandumi bëri thirrje për shtyrjen e iniciativave të tjera, duke përfshirë planet reklamuese për ChatGPT, për t’u përqendruar në përmirësimin e përvojës kryesore të chatbot-it.
Rreziqet për OpenAI janë të konsiderueshme. Kompania ka marrë përsipër angazhime me një total prej 1.4 trilionë dollarësh për ndërtimin e infrastrukturës së IA-së gjatë disa viteve të ardhshme, baste që i vuri kur kishte një epërsi më të dukshme teknologjike midis kompanive të IA-së. Aplikacioni Gemini i Google tani ka më shumë se 650 milionë përdorues aktivë mujorë, ndërsa OpenAI raporton 800 milionë përdorues aktivë javorë për ChatGPT.
Në përpjekje për të mbajtur ritmin me (ose përpara) konkurrencës, publikimet e modeleve vazhdojnë me një ritëm të qëndrueshëm: GPT-5.2 përfaqëson publikimin e tretë të madh të modelit të OpenAI që nga gushti. GPT-5 u lançua atë muaj me një sistem të ri rrugëzimi që kalon midis modaliteteve të përgjigjes së menjëhershme dhe të arsyetimit të simuluar, megjithëse përdoruesit u ankuan për përgjigjet që dukeshin të ftohta dhe klinike. Përditësimi i GPT-5.1 i nëntorit shtoi tetë opsione të paracaktuara “personaliteti” dhe u përqendrua në bërjen e sistemit më bisedor.
Çuditërisht, edhe pse publikimi i modelit GPT-5.2 është në dukje një përgjigje ndaj performancës së Gemini 3, OpenAI zgjodhi të mos rendiste asnjë pikë referimi në faqen e saj promovuese të internetit që krahason dy modelet. Në vend të kësaj, postimi zyrtar në blog përqendrohet në përmirësimet e GPT-5.2 në krahasim me paraardhësit e tij dhe performancën e tij në pikën e re të referencës GDPval të OpenAI , e cila përpiqet të masë detyrat e punës së njohurive profesionale në 44 profesione.
Gjatë konferencës për shtyp, OpenAI ndau disa krahasime të konkurrentëve që përfshinin Gemini 3 Pro dhe Claude Opus 4.5 , por hodhi poshtë rrëfimin se GPT-5.2 u nxitua të dilte në treg në përgjigje të Google. “Është e rëndësishme të theksohet se kjo ka qenë në proces për shumë, shumë muaj,” u tha Simo gazetarëve, megjithëse zgjedhja e kohës së publikimit të saj, do ta theksojmë, është një vendim strategjik.
Sipas shifrave të përbashkëta, GPT-5.2 Thinking shënoi 55.6 përqind në SWE-Bench Pro, një pikë referimi e inxhinierisë softuerike, krahasuar me 43.3 përqind për Gemini 3 Pro dhe 52.0 përqind për Claude Opus 4.5. Në GPQA Diamond, një pikë referimi shkencore në nivel pasuniversitar, GPT-5.2 shënoi 92.4 përqind kundrejt 91.9 përqind të Gemini 3 Pro.

OpenAI thotë se GPT-5.2 Thinking i tejkalon ose barazohet me “profesionistët njerëzorë” në 70.9 përqind të detyrave në standardin GDPval (krahasuar me 53.3 përqind për Gemini 3 Pro). Kompania gjithashtu pretendon se modeli i përfundon këto detyra me më shumë se 11 herë shpejtësinë dhe më pak se 1 përqind të kostos së ekspertëve njerëzorë.
GPT-5.2 Thinking thuhet gjithashtu se gjeneron përgjigje me 38 përqind më pak konfabulacione sesa GPT-5.1, sipas Max Schwarzer, drejtuesit të pas-trajnimit të OpenAI, i cili i tha VentureBeat se modeli “halucinon dukshëm më pak” sesa paraardhësi i tij.
Megjithatë, ne gjithmonë i marrim pikat e referimit me rezervë, sepse është e lehtë t’i paraqesim ato në një mënyrë që është pozitive për një kompani, veçanërisht kur shkenca e matjes objektive të performancës së IA-së nuk i ka arritur ende ofertat e korporatave për aftësitë e IA-së të ngjashme me njerëzit.
Rezultatet e analizave të pavarura nga studiues jashtë OpenAI do të duhet kohë për të mbërritur. Ndërkohë, nëse përdorni ChatGPT për detyra pune, prisni modele kompetente me përmirësime graduale dhe performancë më të mirë të kodimit, të cilat do të jenë të mjaftueshme për t’u përmirësuar.
