Anthropic thuhet se po teston modelet Claude që mund të korrigjojnë vetë gabimet e tyre

Thuhet se Anthropic po përgatit gjeneratën e ardhshme të modeleve të saj Claude, duke synuar autonomi më të madhe dhe aftësinë për t’u vetëkorrigjuar gjatë detyrave komplekse.

Sipas The Information, kompania planifikon të publikojë versione të reja të Claude Opus dhe Sonnet në javët në vijim. Testuesit thonë se këto modele mund të funksionojnë shumë më në mënyrë të pavarur sesa versionet e mëparshme.

Ndryshimi më i madh është në mënyrën se si modelet përziejnë arsyetimin e pavarur me përdorimin e mjeteve të jashtme, duke kaluar pa probleme midis të dyjave sipas nevojës. Nëse modeli ngec gjatë përdorimit të një mjeti, ai kalon në një modalitet “të menduari” për të analizuar se çfarë ka ndodhur dhe për të zgjidhur problemin. Ky shkëmbim mendimesh ka për qëllim të ndihmojë modelet të përballen me sfida komplekse me më pak ndihmë nga përdoruesit.

Një shembull nga The Information është një analizë tregu për një kafene në Manhattan. Modeli fillon duke parë trendet kombëtare, por shpejt kupton se ato nuk janë të dobishme. Pastaj kalon në analizimin e të dhënave demografike nga East Village, me qëllim prodhimin e rekomandimeve më të rëndësishme.

Modelet e reja Claude gjithashtu marrin një rol më aktiv në detyrat e kodimit. Ato testojnë automatikisht kodin që gjenerojnë dhe, nëse diçka shkon keq, ndalen për ta kuptuar dhe rregulluar gabimin vetë. Testuesit e hershëm thonë se ky proces vetëkorrigjues funksionon edhe me kërkesa të gjera si “bëjeni aplikacionin më të shpejtë”, ku modeli do të provojë në mënyrë të pavarur strategji të ndryshme optimizimi.

Qasja e Anthropic përputhet me një trend më të gjerë: ndërtimin e sistemeve të inteligjencës artificiale që mund të vazhdojnë të punojnë me të dhëna minimale dhe të zgjidhin problemet vetë. Modelet e përditësuara Claude janë projektuar për të kombinuar arsyetimin dhe përdorimin e mjeteve, duke kaluar midis dy mënyrave sipas nevojës për detyrën.

Modelet e reja o3 dhe o4-mini të OpenAI funksionojnë në shumë të njëjtën mënyrë. Ndërsa modelet e mëparshme o1 mund të “mendonin” vetëm për hapa shtesë duke gjeneruar tekst, gjenerata e fundit mund të sjellë gjithashtu mjete si kërkimi në internet, të gjenerojë kod ose të analizojë imazhe si pjesë të arsyetimit të tyre. Kjo duhet t’i bëjë ato më fleksibile dhe të fuqishme, megjithëse testet fillestare tregojnë se o3, për shembull, ende bën gabime në detyra komplekse më shpesh sesa modelet e mëparshme të OpenAI.

Tags: AI, Anthropic, Artificial Intelligence, Claude, Claude Opus, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, Manhattan, OpenAI, Sonnet, The Information

Anthropic thuhet se po teston modelet Claude që mund të korrigjojnë vetë gabimet e tyre

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Pse OpenAI në të vërtetë e mbylli Sora

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Eli Lilly and Company bën një bast prej 2.75 miliardë dollarësh në zbulimin e barnave të fuqizuar nga AI

Dyqani i aplikacioneve të ChatGPT has në vështirësi gjashtë muaj pas lançimit

Microsoft Copilot tani po fut reklama në pull request-et në GitHub

Siri i Apple mund të marrë një dyqan aplikacionesh AI të vetin

You may have missed

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Eli Lilly and Company bën një bast prej 2.75 miliardë dollarësh në zbulimin e barnave të fuqizuar nga AI

Dyqani i aplikacioneve të ChatGPT has në vështirësi gjashtë muaj pas lançimit

Microsoft Copilot tani po fut reklama në pull request-et në GitHub

More Stories

You may have missed