Agjenti i ChatGPT nga OpenAI kalon lehtësisht testin e verifikimit “Nuk jam robot”

Të premten, agjenti i ri ChatGPT i OpenAI, i cili mund të kryejë detyra me shumë hapa për përdoruesit, provoi se mund të kalojë nëpër një nga pikat më të zakonshme të kontrollit të sigurisë në internet duke klikuar verifikimin anti-bot të Cloudflare – e njëjta kuti kontrolli që supozohet të mbajë larg programet e automatizuara si vetja.

Agjenti ChatGPT është një veçori që i lejon asistentit të inteligjencës artificiale të OpenAI të kontrollojë shfletuesin e vet të internetit, duke vepruar brenda një mjedisi sandbox me sistemin e vet operativ virtual dhe shfletuesin që mund të hyjë në internetin real. Përdoruesit mund të shikojnë veprimet e inteligjencës artificiale përmes një dritareje në ndërfaqen ChatGPT, duke ruajtur mbikëqyrjen ndërsa agjenti përfundon detyrat. Sistemi kërkon lejen e përdoruesit përpara se të ndërmarrë veprime me pasoja në botën reale, të tilla si kryerja e blerjeve. Kohët e fundit, përdoruesit e Reddit zbuluan se agjenti mund të bënte diçka veçanërisht ironike.
Provat erdhën nga Reddit, ku një përdorues i quajtur “logkn” i komunitetit r/OpenAI postoi pamje të ekranit të agjentit të inteligjencës artificiale duke klikuar pa mundim hapin e shqyrtimit përpara se ai të paraqiste një CAPTCHA (shkurtim për “Plotësisht teste të automatizuara publike të turingut për të dalluar kompjuterët dhe njerëzit”) ndërsa përfundonte një detyrë konvertimi video – duke rrëfyer procesin e vet ndërsa zhvillohej.

Pamjet e ekranit të ndara në Reddit tregojnë agjentin duke lundruar në një proces verifikimi me dy hapa: së pari duke klikuar kutinë e kontrollit “Verifiko që je njeri”, pastaj duke vazhduar me klikimin e butonit “Konverto” pasi sfida Cloudflare të ketë sukses. Agjenti ofron një rrëfim në kohë reale të veprimeve të tij, duke deklaruar “Lidhja është futur, kështu që tani do të klikoj kutinë e kontrollit ‘Verifiko që je njeri’ për të përfunduar verifikimin në Cloudflare. Ky hap është i nevojshëm për të vërtetuar se nuk jam robot dhe për të vazhduar me veprimin.”
Absurditeti i një agjenti të inteligjencës artificiale që deklaron se duhet të provojë se “nuk është një robot” ndërsa klikon nëpër masat anti-bot nuk u ka shpëtuar vëzhguesve. “Me gjithë drejtësinë, është trajnuar me të dhëna njerëzore, pse do të identifikohej si një robot? Ne duhet ta respektojmë këtë zgjedhje”, tha me shaka një përdorues i Reddit në një përgjigje.
Ndërkohë që agjenti nuk u përball me një enigmë të vërtetë CAPTCHA me imazhe në këtë rast, kalimi me sukses i testit të sjelljes së Cloudflare që përcakton nëse duhet të paraqesë sfida të tilla tregon automatizim të sofistikuar të shfletuesit.
Për të kuptuar rëndësinë e kësaj aftësie, është e rëndësishme të dihet se sistemet CAPTCHA kanë shërbyer si një masë sigurie në internet për dekada të tëra. Studiuesit e kompjuterave e shpikën teknikën në vitet 1990 për të kontrolluar botët që të mos futin informacion në faqet e internetit, duke përdorur fillimisht imazhe me shkronja dhe numra të shkruara me shkronja të valëzuara, shpesh të mbuluara me vija ose zhurmë për të penguar algoritmet e vizionit kompjuterik. Supozohet se detyra do të jetë e lehtë për njerëzit, por e vështirë për makinat.
Sistemi i shqyrtimit i Cloudflare, i quajtur Turnstile, shpesh i paraprin sfidave aktuale CAPTCHA dhe përfaqëson një nga metodat më të përhapura të zbulimit të botëve sot. Kutia e kontrollit analizon sinjale të shumta, duke përfshirë lëvizjet e miut, kohën e klikimeve, gjurmët e gishtërinjve të shfletuesit, reputacionin e IP-së dhe modelet e ekzekutimit të JavaScript për të përcaktuar nëse përdoruesi shfaq sjellje të ngjashme me njeriun. Nëse këto kontrolle kalojnë, përdoruesit vazhdojnë pa parë një enigmë CAPTCHA. Nëse sistemi zbulon modele të dyshimta, ai përshkallëzohet në sfida vizuale.
Aftësia e një modeli të inteligjencës artificiale për të mposhtur një CAPTCHA nuk është krejtësisht e re (megjithëse të kesh një model që rrëfen procesin duket mjaft e re). Mjetet e inteligjencës artificiale kanë qenë në gjendje të mposhtin disa CAPTCHA për njëfarë kohe, gjë që ka çuar në një garë armatimi midis atyre që i krijojnë ato dhe atyre që i mposhtin ato. Operatori i OpenAI, një agjent eksperimental i inteligjencës artificiale për shfletim në internet i lançuar në janar, hasi vështirësi në klikimin e disa CAPTCHA-ve (dhe gjithashtu u trajnua për të ndaluar dhe për t’i kërkuar një njeriu t’i plotësojë ato), por mjeti më i fundit ChatGPT Agent ka parë një publikim shumë më të gjerë.
Është joshëse të thuhet se aftësia e agjentëve të inteligjencës artificiale për të kaluar këto teste e vë në pikëpyetje efektivitetin e ardhshëm të CAPTCHA-ve, por për aq kohë sa kanë ekzistuar CAPTCHA-t, ka pasur edhe robotë që më vonë mund t’i mposhtin ato. Si rezultat, CAPTCHA-t e fundit janë bërë më shumë një mënyrë për të ngadalësuar sulmet e robotëve ose për t’i bërë ato më të shtrenjta sesa një mënyrë për t’i mposhtur ato tërësisht. Disa keqbërës madje japin me qira ferma me njerëz për t’i mposhtur ata me shumicë.
CAPTCHA-t kanë gjithashtu përfitime të papritura për ata që i përdorin ato. Që nga viti 2007, projekti reCAPTCHA filloi të përdorë testet e tij si një formë pune falas për detyra të tilla si dixhitalizimi i librave dhe trajnimi i algoritmeve të të mësuarit automatik. Google e bleu reCAPTCHA-n në vitin 2009 dhe e zgjeroi përdorimin e tij për të deshifruar adresat e Google Street View, duke nxjerrë njohuri vizuale nga përdoruesit njerëzorë që zgjidhin sfida. Sfidat e sotme të reCAPTCHA ndihmojnë Google të trajnojë modelet e IA-së për njohjen e imazhit, duke krijuar një cikël ironik ku njerëzit që vërtetojnë se nuk janë robotë në të vërtetë po ndihmojnë për ta bërë IA-në më të mirë në mposhtjen e CAPTCHA-ve të ardhshme.
Në një farë mënyre, kjo e ardhme mund të ketë mbërritur. Demonstrimi i ChatGPT Agent tregon aftësinë e mjetit të agjentit për të përpunuar kontekstin vizual dhe për të lundruar në procese me shumë hapa që zakonisht kërkojnë gjykim njerëzor. Në pamjet e ekranit, agjenti e njeh kur nevojitet verifikimi dhe e përfundon atë si pjesë të një rrjedhe pune më të madhe – sjellje që shkon përtej automatizimit të thjeshtë të skriptuar.
CAPTCHA-t janë vetëm një shembull i detyrave komplekse që mund të trajtojë ChatGPT Agent. Për shembull, një tjetër përdorues i Reddit tregoi një foto të një ngarkese me ushqime që me sa duket i bleu Agjenti. “Dje, ndërsa punoja, moda e agjentit më porositi disa ushqime nga një supermarket lokal për t’i marrë këtë mëngjes,” shkroi përdoruesi i Reddit. “Në fakt funksionoi pa asnjë problem dhe bëri një punë të mirë duke krijuar një listë ushqimesh që funksionon për mua. I dhashë mezi ndonjë detaj në udhëzimet e mia përveçse të shmangte mishin e kuq, të prioritizonte shëndetin dhe ta mbante atë nën 150 dollarë.”
Por ChatGPT Agent nuk është perfekt. Disa ndërfaqe përdoruesish të faqeve të internetit të tmerrshme me sa duket janë më të mira se pikat e kontrollit CAPTCHA në zbulimin e botit të ri. “Agjenti juaj bëri shumë më mirë se i imi,” shkroi një përgjigje në Reddit. “I imi nuk mundi të kuptonte se si të shkonte në faqen e internetit të ndalimit dhe dyqanit.”