Modeli i ri i AI me ‘arsyetim hibrid’ i Anthropic është më i zgjuari deri tani

foto

Anthropic po publikon Claude 3.7 Sonnet, “modeli i tij i parë i arsyetimit hibrid” që mund të zgjidhë probleme më komplekse dhe që tejkalon modelet e mëparshme në fusha si matematika dhe kodimi.

Përveç një modeli të ri, Anthropic po lëshon gjithashtu një “parapamje të kufizuar kërkimore” të mjetit të tij të kodimit “agjent” të quajtur Claude Code. Ndërsa Anthropic tashmë fuqizon mjetet e kodimit të AI si Cursor, ai po e prezanton Claude Code si “një bashkëpunëtor aktiv që mund të kërkojë dhe lexojë kodin, të modifikojë skedarët, të shkruajë dhe të ekzekutojë teste, të kryejë dhe shtyjë kodin në GitHub dhe të përdorë mjetet e linjës së komandës”.

Claude 3.7 Sonnet është i disponueshëm duke filluar nga e hëna në aplikacionin Claude dhe për zhvilluesit përmes API-së së Anthropic, Amazon Bedrock dhe Vertex AI të Google Cloud. Modeli kushton njësoj për t’u përdorur si paraardhësi i tij, 3.5 Sonnet, me 3 dollarë për milion shenja hyrëse dhe 15 dollarë për milion argumente dalëse.

Ndërsa OpenAI dhe të tjerët ofrojnë të ashtuquajtura modele të veçanta arsyetimi, drejtuesja e hulumtimit të produkteve Anthropic, Dianne Penn, thotë për Shkence.info se kompania dëshironte të thjeshtonte përvojën e përdorimit të një modeli. “Ne thelbësisht besojmë se arsyetimi është një veçori e AI dhe jo një gjë krejtësisht e veçantë,” thotë ajo, duke vënë në dukje se Claude nuk duhet të marrë shumë kohë për t’iu përgjigjur pyetjes “sa është ora?” kundrejt përgjigjes ndaj një kërkese më komplekse si, “planifikoni një udhëtim dy-javor në Itali duke marrë parasysh motin në fund të marsit”.

foto
foto

Penn thotë se Claude 3.7 Sonnet performon dukshëm më mirë në “kodimin agjenturor”, financat dhe detyrat ligjore. Ndërsa Claude-it i mungon ende kërkimi në internet në kohë reale si modelet e tjera, data e ndërprerjes së njohurive të versionit 3.7 të tetorit 2024 është më e përditësuar. Anthropic po i lejon gjithashtu zhvilluesit të ndihmojnë në drejtimin e mënyrës se si modeli “mendon” përmes tastierës së tij gërvishtëse dhe madje të diktojnë saktësisht se sa kohë duhet për t’u përgjigjur. “Ndonjëherë zhvilluesi duhet të thotë se nuk duhet të duhen më shumë se 200 milisekonda për t’iu përgjigjur kësaj pyetjeje,” thotë zëvendësi i produktit të Anthropic, Michael Gerstenhaber. “Dhe ky është një vendim produkti.”

Brenda Anthropic, punonjësit kanë përdorur modelin e ri për të ndërtuar dizajne të faqeve të përparme, lojëra interaktive dhe madje shpenzojnë deri në 45 minuta në punën e kodimit duke “ndërtuar grupe testimi dhe duke redaktuar rastet e testimit në mënyrë të përsëritur”, sipas Penn.

foto

Ajo thotë se kompania gjithashtu teston modelet e saj në aftësinë e tyre për të avancuar përmes një video-lojëje të vjetër Pokémon, duke hartuar API-në e modelit në një skemë kontrolluesi. Claude 3.5 Sonnet nuk mundi të dilte nga Pallet Town në fillim të lojës, ndërsa versioni 3.7 ishte në gjendje të mposhtte shumë drejtues palestresh.

Siç tregoi Elon Musk me Grok-3 javën e kaluar, gara e modeleve të AI po ecën jashtëzakonisht shpejt. Tani për tani, Anthropic duket të jetë përsëri në krye falë përfitimeve të performancës së Claude 3.7 Sonnet. Publikimi i tij sugjeron gjithashtu se, në vend që të ofrojë modele të pavarura arsyetimi, industria po lëviz drejt një të ardhmeje ku një model mund të bëjë gjithçka.