OpenAI planifikon ta publikojë GPT-5 “për disa muaj,” ndërsa ndryshon strategjinë për modelet e arsyetimit

Në një postim në X, CEO Sam Altman njoftoi se kompania do të lëshojë modelet e saj të arsyetimit o3 dhe o4-mini si sisteme të pavarura në javët e ardhshme duke përmbysur planet e mëparshme për t’i integruar ato drejtpërdrejt në GPT-5. Modeli i plotë GPT-5 tani pritet të mbërrijë “për disa muaj”.

Sipas Altman, ndryshimi është për shkak të shumë faktorëve. Integrimi i të gjithë komponentëve në një sistem të vetëm të unifikuar ka rezultuar më sfidues nga sa ishte parashikuar fillimisht. Në të njëjtën kohë, periudha shtesë e zhvillimit ka zbuluar se GPT-5 mund të jetë “shumë më i mirë se ne fillimisht edhe pse [SIC].” Altman përmendi gjithashtu nevojën për të siguruar që kapaciteti i mjaftueshëm kompjuterik është i disponueshëm për të përmbushur atë që pret të jetë “kërkesë e paprecedentë”.

Altman vuri në dukje se modeli o3 në veçanti ka pësuar përmirësime të rëndësishme që nga vrojtimi i tij i brendshëm. Ndërsa nuk ka dhënë detaje teknike shtesë, ka deklaruar se “njerëzit do të jenë të lumtur”.
Modelet o3 dhe o4-mini klasifikohen si modele arsyetimi – sisteme të ndërtuara për të kryer detyra komplekse të të menduarit. Sipas OpenAI dhe kompanive të tjera si Deepseek, këto modele kanë treguar performancë më të fortë se modelet e gjuhës konvencionale në fusha si kodimi dhe matematika.
OpenAI prezantoi për herë të parë modelin e tij o3 në dhjetor 2024, duke shënuar një përparim të madh në detyrat komplekse të arsyetimit. Kompania njoftoi gjithashtu një version më të përballueshëm dhe më të shpejtë o3-mini, i cili u lëshua në fund të janarit 2025. Versioni mini përfshin tre mënyra shpejtësie (të ulët, të mesëm dhe të lartë), dhe madje edhe me shpejtësi mesatare, ai tejkalon modelin e mëparshëm o1 për nga shpejtësia dhe efektiviteti i kostos. OpenAI zgjodhi emrin “o3” pas anashkalimit të “o2” për të shmangur konfuzionin me kompaninë e telekomunikacionit O2.
OpenAI fillimisht kishte planifikuar që GPT-4.5 të ishte i fundit në linjën e modeleve të gjuhës konvencionale. GPT-5 kishte për qëllim të bashkonte seritë GPT dhe o-model në një platformë të vetme, duke kombinuar mjete të tilla si përpunimi i gjuhës natyrore, kërkimi dhe kërkimi i thellë në një sistem. Sipas atij plani, o3 nuk pritej të dilte si një model i pavarur.
Qëllimi ishte të ndërtohej ajo që Altman e përshkroi si një “inteligjencë e unifikuar magjike” e aftë për të zgjedhur automatikisht mjetin e duhur për një detyrë të caktuar. GPT-5 ishte planifikuar gjithashtu të lëshohej në nivele të shumta, duke përfshirë versionet falas, Plus dhe Pro.
Altman kohët e fundit theksoi rëndësinë strategjike të “modeleve të mëdha të arsyetimit”. Ai pohoi se o3 tashmë performon në nivelin e një prej 50 programuesve më të mirë në mbarë botën dhe sugjeroi që modelet e ardhshme mund të arrijnë vendin e parë në kodim deri në fund të vitit. Plani origjinal për të futur këto modele në GPT-5 u krijua për të kombinuar aftësitë e specializuara të sistemeve të arsyetimit me fleksibilitetin më të gjerë të modeleve të gjuhës së madhe si GPT-4 .5.