E ardhmja e shfletimit me AI mund të varet nga mënyra se si zhvilluesit e rikonceptojnë ndërtimin e faqeve të internetit
Studiuesit në TU Darmstadt kanë prezantuar kornizën VOIX, duke u dhënë faqeve të internetit dy elementë të rinj HTML në mënyrë që agjentët e inteligjencës artificiale të mund të njohin veprimet e disponueshme pa pasur nevojë të interpretojnë vizualisht ndërfaqet komplekse të përdoruesit.
Elementi rendit veprimet sipas emrit, parametrave dhe përshkrimit. Elementi i jep agjentit informacionin aktual rreth gjendjes së aplikacionit.
Për shembull, një listë detyrash mund të përfshijë një element. Ajo përcakton parametra si “titulli” dhe “prioriteti” dhe lidhet me logjikën e aplikacionit përmes JavaScript. Kur një agjent shton një detyrë, ai e përdor këtë mjet direkt në vend që të kërkojë fusha dhe butona hyrës.

Korniza ndan përgjegjësitë: faqja e internetit deklaron funksionet e saj, një agjent shfletuesi ndërmjetëson midis faqes dhe inteligjencës artificiale, dhe ofruesi i përfundimeve vendos se çfarë të bëjë duke përdorur këto të dhëna të strukturuara.
Ky konfigurim është një ndryshim i madh nga agjentët aktualë, të cilët përpiqen t’i “shohin” faqet e internetit ashtu siç i shohin njerëzit – një proces që nuk është i besueshëm dhe i prirur ndaj sulmeve.
“Agjentët duhet të nxjerrin përfundime nga ndërfaqet e përdoruesit të orientuara drejt njeriut, duke çuar në ndërveprime të brishta, joefikase dhe të pasigurta”, thonë studiuesit. Arkitektura synon gjithashtu të përmirësojë privatësinë. Agjenti i shfletuesit i dërgon bisedat e përdoruesve direkt te ofruesi i LLM, duke e mbajtur faqen e internetit jashtë ciklit. Agjentët shohin vetëm të dhënat që janë lëshuar në mënyrë të qartë, jo të gjithë faqen. VOIX funksionon në anën e klientit, kështu që pronarët e faqeve nuk duhet të paguajnë për përfundimin e LLM.
Për të testuar VOIX, ekipi zhvilloi një hackathon tre-ditor me 16 zhvillues. Gjashtë ekipe ndërtuan aplikacione të ndryshme duke përdorur framework-un, shumica pa përvojë paraprake. Rezultatet tregojnë përdorshmëri të fortë: rezultati i Shkallës së Përdorshmërisë së Sistemit arriti në 72.34, mbi mesataren e industrisë prej 68. Zhvilluesit gjithashtu vlerësuan lart kuptimin dhe performancën e sistemit.

Aplikacionet e ndërtuara gjatë hackathon-it tregojnë fleksibilitetin e VOIX. Një demo i lejoi përdoruesit të bënin dizajn grafik bazë, duke klikuar objekte dhe duke dhënë komanda zanore si “rrotulloje këtë me 45 gradë”. Një aplikacion fitnesi krijoi plane të plota stërvitjeje nga kërkesa të tilla si “krijo një plan stërvitjeje me intensitet të lartë për një javë të tërë për shpinën dhe shpatullat e mia”. Projekte të tjera përfshinin një krijues tingujsh që ndryshon mjediset audio bazuar në komanda të tilla si “bëje të tingëllojë si një pyll tropikal” dhe një mjet Kanban që gjeneron detyra nga kërkesat.
Testet e vonesës tregojnë se VOIX është dukshëm më i shpejtë se agjentët tradicionalë. VOIX i përfundoi detyrat në vetëm 0.91 deri në 14.38 sekonda, krahasuar me 4.25 sekonda deri në mbi 21 minuta për agjentët standardë të shfletuesit të IA-së.
