Bytedance hedh në treg Agent TARS, një agjent automatizimi me AI me burim të hapur

foto

Agjenti TARS është qasja e re me burim të hapur e Bytedance për automatizimin e detyrave komplekse duke interpretuar vizualisht përmbajtjen e uebit dhe duke bashkëvepruar me rreshtin e komandës dhe sistemin e skedarëve. TARS është ende në një fazë eksperimentale dhe aktualisht është i disponueshëm vetëm për macOS.

foto

I zhvilluar nga Bytedance, kompania që qëndron pas TikTok, Agent TARS përdor një strukturë të bazuar në agjentë që mund të planifikojë dhe kryejë automatikisht procese si kërkimi, shfletimi dhe navigimi në lidhje. Komunikimi me ndërfaqen e përdoruesit ndodh përmes një rrjedhe ngjarjesh, duke u lejuar përdoruesve të shohin statuset dhe rezultatet e ndërmjetme në kohë reale.

Agjenti TARS i përpunon faqet e internetit në mënyrë vizuale dhe mbështetet në Protokollin e Kontekstit të Modelit (MCP) të Anthropic për t’u lidhur me mjete si redaktuesit e tekstit, rreshti i komandës dhe sistemet e skedarëve. Një version për Windows është në zhvillim e sipër.

Ndërfaqja ofron një pamje të drejtpërdrejtë të gjithçkaje që agjenti po bën, duke përfshirë dokumentet e hapura, dritaret e shfletuesit dhe objekte të tjera të procesit. Përdoruesit mund të ndërhyjnë në çdo moment duke shtuar udhëzime të reja, duke i lejuar ata të udhëheqin rrjedhën e punës së agjentit ndërsa ai funksionon.

foto

Disa shembuj praktikë janë të disponueshëm në faqen e internetit të projektit, duke përfshirë një analizë teknike të çmimit të aksioneve të Teslës, një përmbledhje të projekteve në trend të ProductHunt, një raport defektesh për depon Lynx dhe një itinerar udhëtimi njëjavor për në Mexico City.

Përdoruesit mund ta eksportojnë të gjithë seancën e agjentit të tyre ose si një skedar HTML lokal ose duke e ngarkuar atë në një server të jashtëm. Nëse ngarkohet, aplikacioni dërgon një kërkesë POST me paketën HTML dhe serveri kthen një lidhje të ndashme.

Pas instalimit të Agent TARS nga GitHub, përdoruesit duhet të konfigurojnë çelësat API për modelin dhe shërbimet e tyre të preferuara të kërkimit. Parametra shtesë si apiVersionose deploymentNamejanë të nevojshëm për integrimin e Azure OpenAI. Aktualisht, Agent TARS funksionon më mirë me Claude, të cilin zhvilluesit e përshkruajnë si opsionin më të mirë të përkohshëm. Mbështetja për modelet OpenAI është ende e paqëndrueshme.

Në një postim të kohëve të fundit në blog, zhvilluesit trajtuan konfuzionin midis Agent TARS dhe UI TARS Desktop. UI TARS Desktop është projektuar për automatizimin e ndërfaqeve grafike të përdoruesit në nivel sistemi dhe përdor modelin e vet UI TARS.