OpenAI planifikon ta publikojë GPT-5 “për disa muaj,” ndërsa ndryshon strategjinë për modelet e arsyetimit

Në një postim në X, CEO Sam Altman njoftoi se kompania do të lëshojë modelet e saj të arsyetimit o3 dhe o4-mini si sisteme të pavarura në javët e ardhshme duke përmbysur planet e mëparshme për t’i integruar ato drejtpërdrejt në GPT-5. Modeli i plotë GPT-5 tani pritet të mbërrijë “për disa muaj”.

Sipas Altman, ndryshimi është për shkak të shumë faktorëve. Integrimi i të gjithë komponentëve në një sistem të vetëm të unifikuar ka rezultuar më sfidues nga sa ishte parashikuar fillimisht. Në të njëjtën kohë, periudha shtesë e zhvillimit ka zbuluar se GPT-5 mund të jetë “shumë më i mirë se ne fillimisht edhe pse [SIC].” Altman përmendi gjithashtu nevojën për të siguruar që kapaciteti i mjaftueshëm kompjuterik është i disponueshëm për të përmbushur atë që pret të jetë “kërkesë e paprecedentë”.

Altman vuri në dukje se modeli o3 në veçanti ka pësuar përmirësime të rëndësishme që nga vrojtimi i tij i brendshëm. Ndërsa nuk ka dhënë detaje teknike shtesë, ka deklaruar se “njerëzit do të jenë të lumtur”.

Modelet o3 dhe o4-mini klasifikohen si modele arsyetimi – sisteme të ndërtuara për të kryer detyra komplekse të të menduarit. Sipas OpenAI dhe kompanive të tjera si Deepseek, këto modele kanë treguar performancë më të fortë se modelet e gjuhës konvencionale në fusha si kodimi dhe matematika.

OpenAI prezantoi për herë të parë modelin e tij o3 në dhjetor 2024, duke shënuar një përparim të madh në detyrat komplekse të arsyetimit. Kompania njoftoi gjithashtu një version më të përballueshëm dhe më të shpejtë o3-mini, i cili u lëshua në fund të janarit 2025. Versioni mini përfshin tre mënyra shpejtësie (të ulët, të mesëm dhe të lartë), dhe madje edhe me shpejtësi mesatare, ai tejkalon modelin e mëparshëm o1 për nga shpejtësia dhe efektiviteti i kostos. OpenAI zgjodhi emrin “o3” pas anashkalimit të “o2” për të shmangur konfuzionin me kompaninë e telekomunikacionit O2.

OpenAI fillimisht kishte planifikuar që GPT-4.5 të ishte i fundit në linjën e modeleve të gjuhës konvencionale. GPT-5 kishte për qëllim të bashkonte seritë GPT dhe o-model në një platformë të vetme, duke kombinuar mjete të tilla si përpunimi i gjuhës natyrore, kërkimi dhe kërkimi i thellë në një sistem. Sipas atij plani, o3 nuk pritej të dilte si një model i pavarur.

Qëllimi ishte të ndërtohej ajo që Altman e përshkroi si një “inteligjencë e unifikuar magjike” e aftë për të zgjedhur automatikisht mjetin e duhur për një detyrë të caktuar. GPT-5 ishte planifikuar gjithashtu të lëshohej në nivele të shumta, duke përfshirë versionet falas, Plus dhe Pro.

Altman kohët e fundit theksoi rëndësinë strategjike të “modeleve të mëdha të arsyetimit”. Ai pohoi se o3 tashmë performon në nivelin e një prej 50 programuesve më të mirë në mbarë botën dhe sugjeroi që modelet e ardhshme mund të arrijnë vendin e parë në kodim deri në fund të vitit. Plani origjinal për të futur këto modele në GPT-5 u krijua për të kombinuar aftësitë e specializuara të sistemeve të arsyetimit me fleksibilitetin më të gjerë të modeleve të gjuhës së madhe si GPT-4 .5.

Tags: AI, Artificial Intelligence, DeepSeek, GPT, GPT-4.5, GPT-5, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, OpenAI, Sam Altman, X

OpenAI planifikon ta publikojë GPT-5 “për disa muaj,” ndërsa ndryshon strategjinë për modelet e arsyetimit

Përplasja e Anthropic me Pentagon ka të bëjë me më shumë sesa vetëm rregullat mbrojtëse të AI

Burger King do të përdorë AI për të kontrolluar nëse punonjësit thonë “ju lutem” dhe “faleminderit”

Perplexity lançon agjentin AI “Computer” që koordinon 19 modele, me çmim 200 dollarë në muaj

Përplasja e Anthropic me Pentagon ka të bëjë me më shumë sesa vetëm rregullat mbrojtëse të AI

Jane Street akuzohet për manipulimin e çmimeve të Bitcoin

Burger King do të përdorë AI për të kontrolluar nëse punonjësit thonë “ju lutem” dhe “faleminderit”

Perplexity lançon agjentin AI “Computer” që koordinon 19 modele, me çmim 200 dollarë në muaj

New York padit Valve për loot box-et që shkelin ligjet shtetërore të lojërave të fatit

Google lançon modelin Nano Banana 2 me gjenerim më të shpejtë të imazheve

You may have missed

Përplasja e Anthropic me Pentagon ka të bëjë me më shumë sesa vetëm rregullat mbrojtëse të AI

Jane Street akuzohet për manipulimin e çmimeve të Bitcoin

Burger King do të përdorë AI për të kontrolluar nëse punonjësit thonë “ju lutem” dhe “faleminderit”

Perplexity lançon agjentin AI “Computer” që koordinon 19 modele, me çmim 200 dollarë në muaj

New York padit Valve për loot box-et që shkelin ligjet shtetërore të lojërave të fatit

More Stories

You may have missed