OpenAI lançon GPT-5.4 mini dhe GPT-5.4 nano me performancë afër nivelit flagship me kosto shumë më të ulët
Modeli më i fundit mini GPT-5.4 ofron rezultate referuese çuditërisht të ngjashme me modelin e plotë GPT-5.4, ndërsa funksionon shumë më shpejt, duke sinjalizuar një zhvendosje drejt modeleve më të vogla të inteligjencës artificiale që fuqizojnë aplikacionet e botës reale.

Gjatë disa javëve të fundit, kemi parë gjenerimin e modeleve kryesore të gjuhëve të mëdha të OpenAI që kalojnë nga GPT-5.3 në GPT-5.4. Mendojeni modelin si motorin që fuqizon llogaritjen e IA-së. Çdo kërcim brezash zakonisht rezulton në rritje të performancës dhe saktësisë.

Publikimet aktuale mund të jenë pak të vështira për t’u ndjekur pa një tabelë rezultatesh. Më 5 mars, OpenAI publikoi GPT-5.4 Thinking, një model të menduari të thelluar dhe me performancë të lartë. Dy ditë më parë, ajo publikoi GPT-5.3 (jo 5.4) Instant , një model që “i bën bisedat e përditshme më të dobishme dhe rrjedhëse në mënyrë të vazhdueshme”, por jo domosdoshmërisht më të sakta.
Këtë javë, OpenAI po publikon modelet GPT-5.4 mini dhe GPT-5.4 nano. Këto modele janë të dizajnuara për ngarkesa pune të shpejta, efikase dhe me volum të lartë të inteligjencës artificiale. Këto janë në thelb ofertat e modeleve gjuhësore me çmim të ulët.
Për shumë rrjedha pune të inteligjencës artificiale, modeli më efektiv është ai që balancon performancën e fortë me përgjigje të shpejta dhe përdorim të besueshëm të mjeteve.
Sipas OpenAI, “Këto modele janë ndërtuar për llojet e ngarkesave të punës ku vonesa formëson drejtpërdrejt përvojën e produktit: asistentë kodimi që duhet të ndihen të përgjegjshëm, nënagjentë që përfundojnë shpejt detyrat mbështetëse, sisteme që përdorin kompjuterë që kapin dhe interpretojnë pamje të ekranit dhe aplikacione multimodale që mund të arsyetojnë mbi imazhet në kohë reale.”
Kompania tha, “Në këto mjedise, modeli më i mirë shpesh nuk është më i madhi – është ai që mund të përgjigjet shpejt, të përdorë mjetet në mënyrë të besueshme dhe prapëseprapë të kryejë mirë detyra komplekse profesionale.”
Krahasuar me GPT-5 mini, GPT-5.4 mini përmirësohet në kodim, arsyetim, të kuptuarit multimodal dhe përdorimin e mjeteve. Modeli funksionon më shumë se dy herë më shpejt se GPT-5 mini.
GPT-5.4 nano është modeli më i vogël dhe më i shpejtë, që synon klasifikimin, nxjerrjen, renditjen dhe detyra më të thjeshta të mbështetjes së kodimit.
Kur shohim modelet më të vogla dhe më pak të kushtueshme, performanca është faktori dallues. Blerësit duan të dinë se sa vlerë për paratë që marrin. Për të ilustruar këtë performancë, OpenAI po tregon përfitime të konsiderueshme krahasuar me modelet e lançuara vetëm disa muaj më parë:
GPT-5.4 mini shënon 54.38% në SWE-bench Pro krahasuar me 45.69% për GPT-5 mini.
Në Terminal-Bench 2.0, GPT-5.4 mini arrin 60.00%, kundrejt 38.20% për GPT-5 mini.
Në GPQA Diamond, GPT-5.4 mini shënon 88.01%, duke iu afruar 93.00% të GPT-5.4.
Rezultatet e verifikuara nga OSWorld tregojnë se GPT-5.4 mini është në 72.13%, dukshëm më e lartë se 42% e GPT-5 mini.
GPT-5.4 mini i afrohet shkallës së kalueshmërisë në nivelin GPT-5.4, ndërkohë që ofron ekzekutim më të shpejtë. Me fjalë të tjera, modeli më i vogël dhe më i lehtë GPT-5.4 mini performon pothuajse aq mirë sa modeli i plotë GPT-5.4 në testet krahasuese (“shkallët e kalueshmërisë”) që matin nëse modeli i zgjidh problemet saktë.
GPT-5.4 nano e ndan diferencën. Për shembull, ai shënon 52.39% në SWE-bench Pro dhe 46.30% në Terminal Bench 2.0, jo aq i lartë sa GPT-5.4 mini, por prapëseprapë dukshëm më i mirë se GPT-5 mini.
Specialisti i teknologjisë Hebbia ndërton mjete që i ndihmojnë profesionistët të gërmojnë në koleksione të mëdha dokumentesh duke përdorur gjuhën natyrore. Ofertat e tyre u drejtohen përdoruesve në sektorë të tillë si financa, ligji dhe kërkimi, ku aftësia për të analizuar dhe nxjerrë njohuri nga shumë dokumente njëkohësisht është veçanërisht e dobishme.
Sipas Aabhas Sharma, CTO në Hebbia: “GPT-5.4 mini ofron performancë të fortë nga fillimi në fund për një model në këtë klasë. Në vlerësimet tona, ai u përputh ose tejkaloi modelet konkurruese në disa detyra dalëse dhe rikthimin e citimeve me një kosto shumë më të ulët. Ai gjithashtu arriti shkallë më të larta kalueshmërie nga fillimi në fund dhe atribuim burimi më të fortë sesa modeli më i madh GPT-5.4.”
Hapësira dixhitale e punës Notion është e preferuara e atyre që merren me produktivitet të bazuar në internet. Po e shkruaj këtë artikull në hapësirën time të punës në Notion. Teknologjia ofron një strehë për të dhëna të strukturuara dhe të pastrukturuara. Gjithashtu mund të përdorni Notion për të ndërtuar mini-aplikacione pa kod për menaxhimin e informacionit. Unë përdor Notion për të ndjekur prodhimin e artikujve të mi, projektet e brendshme, planet e videove, projektet e zhvillimit dhe më shumë.
Abhisek Modi, drejtuesi i inxhinierisë së inteligjencës artificiale në Notion, tha: “GPT-5.4 mini trajton detyra të fokusuara dhe të përcaktuara mirë me një saktësi mbresëlënëse. Për redaktimin e faqeve konkretisht, ai përputhej dhe shpesh tejkalonte GPT-5.2 në trajtimin e formatimit kompleks me një pjesë të vogël të kohës së llogaritur.”
Modi vazhdoi: “Deri vonë, vetëm modelet më të shtrenjta mund të lundronin në mënyrë të besueshme në thirrjet e mjeteve agjentike. Sot, modelet më të vogla si GPT-5.4 mini dhe nano mund ta përballojnë lehtësisht këtë, gjë që do t’u lejojë përdoruesve tanë të ndërtojnë Agjentë të Personalizuar në Notion të zgjedhin saktësisht sasinë e inteligjencës që u nevojitet.”
Nuk kam mbetur shumë i impresionuar nga inteligjenca artificiale e Notion. Shpresoj që, duke përfshirë këto modele të reja, performanca e Notion AI do të përmirësohet ndjeshëm.
Kur fillon të shikosh se si agjentët përshtaten në ekosistemin e përgjithshëm, bëhet e qartë se IA mund të strukturohet për të pasqyruar operacionet njerëzore në botën reale. Për shembull, mund të kombinosh një model më të fuqishëm të IA-së (si GPT-5.4 Thinking) me modele më të shpejta dhe më të lira si GPT-5.4 mini në të njëjtën mënyrë që mund të kesh një inxhinier të lartë që menaxhon një ekip inxhinierësh të rinj.
Sistemet agjentike mund të kombinojnë modele të madhësive të ndryshme, me modele më të mëdha që planifikojnë detyra dhe modele më të vogla që ekzekutojnë nën-detyra. Në këtë kontekst, GPT-5.4 mini mund të trajtojë punën e nën-agjentëve, siç është kërkimi i bazave të kodit, rishikimi i skedarëve dhe përpunimi i dokumenteve.
OpenAI tha: “GPT-5.4 mini është gjithashtu i fortë në detyrat multimodale, veçanërisht ato që lidhen me përdorimin e kompjuterit. Modeli mund të interpretojë shpejt pamjet e ekranit të ndërfaqeve të dendura të përdoruesit për të përfunduar detyrat e përdorimit të kompjuterit me shpejtësi.”
GPT-5.4 mini është i disponueshëm në versionet API, Codex dhe ChatGPT. Për përdoruesit e nivelit Free dhe Go, GPT-5.4 mini është i arritshëm nëpërmjet opsionit “Thinking” në menynë plus. OpenAI tha: “Për të gjithë përdoruesit e tjerë, GPT-5.4 mini është i disponueshëm si një rezervë e limitit të shpejtësisë për GPT-5.4 Thinking.”
Kompania tha se për programuesit, GPT-5.4 mini është i disponueshëm në të gjithë aplikacionin Codex, CLI, zgjerimin IDE dhe uebin. OpenAI tha se modeli mini “Përdor vetëm 30% të kuotës GPT-5.4, duke i lejuar zhvilluesit të trajtojnë shpejt detyra më të thjeshta kodimi në Codex për rreth një të tretën e kostos”. Për më tepër, Codex gjithashtu mund t’u delegojë nën-agjentëve GPT-5.4 mini në mënyrë që puna që kërkon më pak arsyetim të funksionojë në modelin më pak të kushtueshëm.
Mund të shihni se si krahasohen kostot kur i shikoni ato krah për krah:
Çmimi mini i GPT-5.4 është 0,75 dollarë për milion tokena hyrëse dhe 4,50 dollarë për milion tokena dalëse me një dritare konteksti 400k.
GPT-5.4 nano është vetëm me API dhe kushton 0.20 dollarë për milion tokena hyrëse dhe 1.25 dollarë për milion tokena dalëse.
Në krahasim, GPT-5.4 ka një çmim prej 2.50 dollarë për milion tokena hyrëse dhe 15.00 dollarë për milion tokena dalëse. Kjo është shumë më e shtrenjtë. Është e kuptueshme që nëse po përpiqeni të mbani kostot të ulëta dhe nuk keni nevojë për fuqi shtesë përpunimi, është më mirë të përdorni modelet mini dhe nano.
A keni eksperimentuar me modele më të vogla të inteligjencës artificiale, si GPT-5.4 mini ose nano, në rrjedhat tuaja të punës? A preferoni të përdorni modelet më të mëdha në dispozicion, apo mendoni se modelet më të shpejta dhe më të lira janë shpesh “mjaftueshëm të mira” për detyra në kohë reale si kodimi, analiza e dokumenteve ose rrjedhat e punës së agjentëve?
