Anthropic prezanton modelin Opus 4.5 më të lirë, më të fuqishëm dhe më efikas

foto

Anthropic publikoi sot Opus 4.5, modelin e saj kryesor frontier, i cili sjell përmirësime në performancën e kodimit, si dhe disa përmirësime në përvojën e përdoruesit që e bëjnë atë në përgjithësi më konkurrues me modelet më të fundit frontiere të OpenAI.

foto

Ndoshta ndryshimi më i spikatur për shumicën e përdoruesve është se në përvojat e aplikacioneve të konsumatorit (ueb, celular dhe desktop), Claude do të jetë më pak i prirur ndaj ndërprerjeve të menjëhershme të bisedave sepse ato kanë zgjatur shumë. Përmirësimi i kujtesës brenda një bisede të vetme nuk vlen vetëm për Opus 4.5, por për çdo model aktual Claude në aplikacione.

foto

Përdoruesit që përjetuan mbyllje të papritura (pavarësisht se kishin hapësirë ​​të mbetur në seancën e tyre dhe buxhetet e përdorimit javor) po përballeshin me një dritare konteksti të vështirë (200,000 tokena). Ndërsa disa implementime të modeleve të mëdha gjuhësore thjesht fillojnë të shkurtojnë mesazhet e mëparshme nga konteksti kur një bisedë kalon maksimumin në dritare, Claude thjesht e mbylli bisedën në vend që t’i lejonte përdoruesit të përjetonte një bisedë gjithnjë e më të paqëndrueshme ku modeli do të fillonte të harronte gjëra bazuar në moshën e tyre.

Tani, Claude do të kalojë nëpër një proces prapa skenave të përmbledhjes së pikave kryesore nga pjesët e mëparshme të bisedës, duke u përpjekur të hedhë poshtë atë që e konsideron të panevojshme duke mbajtur atë që është e rëndësishme.

Zhvilluesit që telefonojnë API-n e Anthropic mund të shfrytëzojnë të njëjtat parime përmes menaxhimit të kontekstit dhe ngjeshjes së kontekstit.

Opus 4.5 është modeli i parë që tejkalon një rezultat saktësie prej 80 përqind – konkretisht, 80.9 përqind në testin e verifikuar SWE-Bench, duke tejkaluar me vështirësi modelin GPT-5.1-Codex-Max të lëshuar së fundmi nga OpenAI (77.9 përqind) dhe Gemini 3 Pro të Google (76.2 përqind). Modeli performon veçanërisht mirë në testet e kodimit agjentik dhe përdorimit të mjeteve agjentike, por ende mbetet prapa GPT-5.1 në arsyetimin vizual (MMMU).

Anthropic gjithashtu pohon se Opus 4.5 është shumë më pak i ndjeshëm ndaj sulmeve të injektimit të menjëhershëm sesa modelet e mëparshme Claude, ose sesa modelet konkurruese si GPT-5.1 dhe Gemini 3 Pro. Megjithatë, asnjë nga këto modele nuk ka performancë të përsosur në këtë aspekt.

Ndërsa përmirësimet në performancë në testet e performancës ia vlen të përmenden, përmirësimi më domethënës në Opus 4.5 është padyshim se është dukshëm më efikas me token-at. Postimi në blog i Anthropic ofron shembuj:

I vendosur në një nivel mesatar përpjekjeje, Opus 4.5 përputhet me rezultatin më të mirë të Sonnet 4.5 në SWE-bench Verified, por përdor 76% më pak tokena dalëse. Në nivelin më të lartë të përpjekjes, Opus 4.5 e tejkalon performancën e Sonnet 4.5 me 4.3 pikë përqindjeje – ndërsa përdor 48% më pak tokena.

Lançimi i Opus 4.5 shoqërohet me veçori të tjera të reja për zhvilluesit dhe përdoruesit.

Për shembull, platforma e zhvilluesve tani përfshin një parametër të ri “përpjekjeje”, duke u lejuar zhvilluesve të akordojnë më saktë ekuilibrin që dëshirojnë midis efikasitetit dhe përdorimit të tokenëve.

Gjithashtu, Claude Code tani është i disponueshëm në aplikacionet Claude për desktop. Më parë, ishte i disponueshëm nëpërmjet rreshtit të komandës, zgjerimeve IDE dhe uebit – në disa vende, por jo në aplikacionet origjinale të desktopit. Ndërfaqja e Claude për desktop tani është e ndarë në skeda midis përvojës tradicionale të bisedës dhe përvojës Claude Code.

Dhe së fundmi (dhe për disa, më e rëndësishmja), ka një ndryshim të madh në çmimin e API-t për Opus 4.5. Kostoja tani është 5 dollarë (hyrje)/25 dollarë (dalje) për milion token, nga 15 dollarë/75 dollarë që ishte më parë.