OpenAI vazhdon ofensivën e saj “code red” me një model të ri për gjenerimin e imazheve
OpenAI po lançon një version të ri të ChatGPT Images që premton ndjekje më të mirë të udhëzimeve, redaktim më të saktë dhe shpejtësi deri në 4 herë më të larta të gjenerimit të imazheve.

Modeli i ri, i quajtur GPT Image 1.5, është i disponueshëm duke filluar nga e marta për të gjithë përdoruesit e ChatGPT dhe nëpërmjet API-t. Ky është përshkallëzimi më i fundit në konkurrencë me Gemini të Google, pasi CEO i OpenAI, Sam Altman, muajin e kaluar deklaroi një “kod të kuq” në një memo të brendshme të rrjedhur. Memoja detajoi planet e OpenAI për të rifituar pozicionin e saj si lider në IA pasi Google kishte filluar të merrte pjesë të tregut pas publikimit të Gemini 3, modelit të saj më të fundit kryesor, dhe Nano Banana Pro, versionit më të ri të gjeneratorit viral të imazheve të Google – të dy prej të cilëve kanë kryesuar renditjen e LMArena në shumë teste.
Google e ruan epërsinë e saj edhe pasi OpenAI iu përgjigj suksesit të saj javën e kaluar me lançimin e GPT-5.2 , duke e paraqitur atë si modelin e saj më të përparuar deri më tani për zhvilluesit dhe përdorimin e përditshëm profesional. Thuhet se OpenAI kishte planifikuar të lançonte një gjenerator të ri imazhesh në fillim të janarit, duke i përshpejtuar këto plane me njoftimin e kësaj jave. Publikimi i fundit i modelit të imazhit ishte GPT Image 1 në prill.
GPT Image 1.5 vjen ndërsa gjeneratorët e imazheve dhe videove përparojnë përtej prototipeve dhe fitojnë më shumë aftësi të gatshme për prodhim. Ashtu si Nano Banana Pro, ChatGPT Image ofron veçori pas-prodhimi, duke ofruar kontrolle më të detajuara të redaktimit për të ruajtur qëndrueshmërinë vizuale, si ngjashmëria e fytyrës, ndriçimi, kompozimi dhe toni i ngjyrave në të gjitha redaktimet.

Shumica e mjeteve të imazhit GenAI nuk janë të mira në përsëritje, kështu që ky do të ishte një hap i madh përpara. Nëse kërkohet një ndryshim specifik, si “rregullimi i shprehjes së fytyrës” ose “bërja e ndriçimit më të ftohtë”, modelet shpesh do ta riinterpretojnë të gjithë imazhin, duke çuar në mungesë konsistence.
Përditësimi nuk ka të bëjë vetëm me veçoritë e reja. Imazhet e ChatGPT do të jenë gjithashtu të arritshme nëpërmjet një pike hyrjeje të dedikuar në shiritin anësor të ChatGPT që funksionon “më shumë si një studio krijuese”, shkroi në një postim në blog të martën Fidji Simo, CEO i aplikacioneve të OpenAI.
“Ekranet e reja të shikimit dhe redaktimit të imazheve e bëjnë më të lehtë krijimin e imazheve që përputhen me vizionin tuaj ose marrjen e frymëzimit nga udhëzimet në trend dhe filtrat e paracaktuar”, shkroi Simo.
Përveç gjeneratorit të ri të imazheve, OpenAI po prezanton mënyra të reja për të përmirësuar përvojën e ChatGPT me më shumë elementë vizualë. Plani është që pyetjet e kërkimit të shfaqin më shumë pamje me burime të qarta, të cilat mund të jenë të dobishme për detyra të tilla si konvertimi i matjeve ose kontrollimi i rezultateve sportive, sipas Simo.
“Kur krijoni, duhet të jeni në gjendje ta shihni dhe t’i jepni formë gjësë që po krijoni. Kur pamjet tregojnë një histori më mirë sesa vetëm fjalët, ChatGPT duhet t’i përfshijë ato”, shkroi Simo. “Kur keni nevojë për një përgjigje të shpejtë ose hapi tjetër ndodhet në një mjet tjetër, ai duhet të jetë aty. Ndërsa e bëjmë këtë, mund të vazhdojmë të ngushtojmë distancën midis asaj që keni në mendje dhe aftësisë suaj për ta sjellë atë në jetë.”
