Anthropic thuhet se po teston modelet Claude që mund të korrigjojnë vetë gabimet e tyre

foto

Thuhet se Anthropic po përgatit gjeneratën e ardhshme të modeleve të saj Claude, duke synuar autonomi më të madhe dhe aftësinë për t’u vetëkorrigjuar gjatë detyrave komplekse.

foto

Sipas The Information, kompania planifikon të publikojë versione të reja të Claude Opus dhe Sonnet në javët në vijim. Testuesit thonë se këto modele mund të funksionojnë shumë më në mënyrë të pavarur sesa versionet e mëparshme.

foto

Ndryshimi më i madh është në mënyrën se si modelet përziejnë arsyetimin e pavarur me përdorimin e mjeteve të jashtme, duke kaluar pa probleme midis të dyjave sipas nevojës. Nëse modeli ngec gjatë përdorimit të një mjeti, ai kalon në një modalitet “të menduari” për të analizuar se çfarë ka ndodhur dhe për të zgjidhur problemin. Ky shkëmbim mendimesh ka për qëllim të ndihmojë modelet të përballen me sfida komplekse me më pak ndihmë nga përdoruesit.

Një shembull nga The Information është një analizë tregu për një kafene në Manhattan. Modeli fillon duke parë trendet kombëtare, por shpejt kupton se ato nuk janë të dobishme. Pastaj kalon në analizimin e të dhënave demografike nga East Village, me qëllim prodhimin e rekomandimeve më të rëndësishme.

Modelet e reja Claude gjithashtu marrin një rol më aktiv në detyrat e kodimit. Ato testojnë automatikisht kodin që gjenerojnë dhe, nëse diçka shkon keq, ndalen për ta kuptuar dhe rregulluar gabimin vetë. Testuesit e hershëm thonë se ky proces vetëkorrigjues funksionon edhe me kërkesa të gjera si “bëjeni aplikacionin më të shpejtë”, ku modeli do të provojë në mënyrë të pavarur strategji të ndryshme optimizimi.

Qasja e Anthropic përputhet me një trend më të gjerë: ndërtimin e sistemeve të inteligjencës artificiale që mund të vazhdojnë të punojnë me të dhëna minimale dhe të zgjidhin problemet vetë. Modelet e përditësuara Claude janë projektuar për të kombinuar arsyetimin dhe përdorimin e mjeteve, duke kaluar midis dy mënyrave sipas nevojës për detyrën.

Modelet e reja o3 dhe o4-mini të OpenAI funksionojnë në shumë të njëjtën mënyrë. Ndërsa modelet e mëparshme o1 mund të “mendonin” vetëm për hapa shtesë duke gjeneruar tekst, gjenerata e fundit mund të sjellë gjithashtu mjete si kërkimi në internet, të gjenerojë kod ose të analizojë imazhe si pjesë të arsyetimit të tyre. Kjo duhet t’i bëjë ato më fleksibile dhe të fuqishme, megjithëse testet fillestare tregojnë se o3, për shembull, ende bën gabime në detyra komplekse më shpesh sesa modelet e mëparshme të OpenAI.