OpenAI lëshon modelin e ri të arsyetimit o3-mini falas

foto

Të enjten, Microsoft njoftoi se po prezanton modelin e arsyetimit o1 të OpenAI për përdoruesit e tij Copilot dhe tani OpenAI po lëshon një model të ri arsyetimi, o3-mini, për njerëzit që përdorin versionin falas të ChatGPT. Kjo do të shënojë herën e parë që shumica dërrmuese e njerëzve do të kenë akses në një nga modelet e arsyetimit të OpenAI, të cilat më parë ishin të kufizuara në paketat e tij me pagesë Pro dhe Plus.

foto

Modelet e arsyetimit përdorin një teknikë të “zinxhirit të mendimit” për të gjeneruar përgjigje, në thelb duke punuar përmes një problemi të paraqitur në model hap pas hapi. Duke përdorur këtë metodë, modeli mund të gjejë gabime në procesin e tij dhe t’i korrigjojë ato përpara se të japë një përgjigje. Kjo zakonisht rezulton në përgjigje më të plota dhe të sakta, por gjithashtu bën që modelet të ndalojnë përpara se të përgjigjen, duke çuar ndonjëherë në kohë të gjata pritjeje. OpenAI pretendon se o3-mini përgjigjet 24% më shpejt se o1-mini.

foto

Këto lloj modelesh janë më të efektshmet në zgjidhjen e problemeve komplekse, kështu që nëse keni ndonjë problem matematikor të nivelit të doktoraturës që po ia dilni, mund t’i provoni ato. Përndryshe, nëse keni pasur probleme me marrjen e modeleve të mëparshme për t’iu përgjigjur siç duhet kërkesave tuaja më të avancuara, mund të dëshironi të provoni këtë model të ri arsyetimi mbi to. Për të provuar o3-mini, thjesht zgjidhni “Arsyeja” kur filloni një kërkesë të re në ChatGPT.

Megjithëse modelet e arsyetimit kanë aftësi të reja, ato kanë një kosto. O1-mini i OpenAI është 20 herë më i shtrenjtë për t’u përdorur sesa modeli i tij ekuivalent pa arsyetim, GPT-4o mini. Kompania thotë se modeli i saj i ri, o3-mini, kushton 63% më pak se o1-mini për token hyrëse Megjithatë, me 1,10 dollarë për milion shenja hyrëse, është ende rreth shtatë herë më i shtrenjtë për t’u ekzekutuar se GPT-4o mini.

Ky model i ri vjen menjëherë pas publikimit të DeepSeek që tronditi botën e AI më pak se dy javë më parë. Modeli i ri i DeepSeek performon po aq mirë sa modelet më të mira OpenAI, por kompania kineze pretendon se ka kushtuar afërsisht 6 milionë dollarë për të trajnuar, në krahasim me koston e vlerësuar prej mbi 100 milionë dollarë për trajnimin e GPT-4 të OpenAI. (Vlen të përmendet se shumë njerëz po e marrin në pyetje këtë pretendim.)

Për më tepër, modeli i arsyetimit të DeepSeek kushton 0,55 dollarë për milion argumente hyrëse, gjysma e çmimit të o3-mini, kështu që OpenAI ka ende një rrugë për të bërë për të ulur kostot e tij. Është vlerësuar se modelet e arsyetimit kanë gjithashtu kosto shumë më të larta energjie se llojet e tjera, duke pasur parasysh numrin më të madh të llogaritjeve që ata kërkojnë për të dhënë një përgjigje.

Kjo valë e re e modeleve të arsyetimit paraqet gjithashtu sfida të reja sigurie. OpenAI përdori një teknikë të quajtur përafrim diskutues për të trajnuar modelet e saj të serive o, duke i referuar në thelb politikat e brendshme të OpenAI në çdo hap të arsyetimit të saj për t’u siguruar që ata nuk po injoronin asnjë rregull.

Por kompania ka zbuluar se o3-mini, si modeli o1, është dukshëm më i mirë se modelet pa arsyetim në jailbreaking dhe “vlerësime sfiduese të sigurisë” – në thelb, është shumë më e vështirë të kontrollosh një model arsyetimi duke pasur parasysh aftësitë e tij të avancuara. o3-mini është modeli i parë që shënon si “rrezik të mesëm” në autonominë e modelit, një vlerësim i dhënë sepse është më i mirë se modelet e mëparshme në detyra specifike kodimi – duke treguar “potencial më të madh për vetë-përmirësim dhe përshpejtim të kërkimit të AI”, sipas OpenAI. Thënë kështu, modeli është ende i keq në kërkimet e botës reale. Nëse do të ishte më mirë në këtë, do të vlerësohej si rrezik i lartë dhe OpenAI do të kufizonte lëshimin e modelit.