Anthropic prezanton Claude Fable 5
Anthropic ka publikuar Claude Fable 5, modelin e parë të disponueshëm publikisht në të ashtuquajturën klasë Mythos. Testet e hershme tregojnë një hap të madh në performancën e kodimit, por filtrat e sigurisë, çmimet dhe politikat e ruajtjes së të dhënave po tërheqin kritika të ashpra.

Me Claude Fable 5, Anthropic ka sjellë një model që tejkalon pothuajse çdo standard. Fable 5 është versioni i parë publikisht i disponueshëm i “klasës Mythos”. Sipas Anthropic, Fable ndan modelin e tij bazë me Claude Mythos 5, por shton mbrojtje të rrepta që bllokojnë kërkesat potencialisht të dëmshme që lidhen me sigurinë kibernetike, biologjinë, kiminë dhe distilimin e modelit. Mythos 5 është gjithashtu i disponueshëm, por i kufizuar në një grup të vogël përdoruesish.

Ajo që në të vërtetë do të thotë “Mythos” në një nivel teknik është kryesisht hamendje. Çdo CEO Dan Shipper, ekipi i të cilit kishte akses të hershëm, raporton se stafi i Anthropic i tha se nuk ka asgjë të veçantë në lidhje me arkitekturën. Brenda familjes Haiku, Sonnet dhe Opus, Mythos thjesht i referohet modelit më të madh dhe më të aftë. Zhvilluesi Simon Willison dyshon të njëjtën gjë, se është modeli më i madh Anthropic i disponueshëm publikisht deri më sot. Fable thjesht ndihet “i madh”, shkruan Willison, “jo vetëm në aspektin e shpejtësisë dhe kostos, por edhe në atë se sa di”. Artificial Analysis e mbështet këtë: në pikën e saj të njohurive dhe halucinacioneve AA-Omniscience, Fable shënon 40 pikë, shtatë më shumë se lideri i mëparshëm, Gemini 3.1 Pro. Midis modeleve me peshë të hapur, ky lloj hendeku zakonisht ndjek madhësinë e modelit.
Fable 5 kryeson pothuajse çdo renditje. Në Indeksin e Inteligjencës së Analizës Artificiale , ai arrin 64.9 pikë, afërsisht pesë përpara GPT-5.5 si konkurrenti më i afërt. Në GDPval-AA, një pikë referimi agjentësh për detyrat e punës në botën reale, ai shënon një rezultat Elo prej 1,932. Në Provën e Fundit të Njerëzimit, Fable arrin 53 përqind, më shumë se shtatë pikë mbi Opus 4.8. Një ekzekutim i vetëm i atij testi kushtoi rreth 2,200 dollarë, duke përfshirë kostot rezervë.
