Trendi i ri viral me ChatGPT përfshin kërkimin e vendndodhjes së kundërt nga fotot

foto

Ka një tendencë të re disi shqetësuese që po bëhet virale: njerëzit po përdorin ChatGPT për të kuptuar vendndodhjen e treguar në foto.

foto

Këtë javë, OpenAI publikoi modelet e tij më të reja të AI, o3 dhe o4-mini, të cilat të dyja mund të “arsyetojnë” në mënyrë unike përmes imazheve të ngarkuara. Në praktikë, modelet mund të presin, rrotullojnë dhe zmadhojnë fotot – madje edhe ato të paqarta dhe të shtrembëruara – për t’i analizuar ato tërësisht.

foto

Këto aftësi të analizimit të imazheve, të shoqëruara me aftësinë e modeleve për të kërkuar në ueb, krijojnë një mjet të fuqishëm për gjetjen e vendndodhjes. Përdoruesit në X zbuluan shpejt se o3, në veçanti, është mjaft i mirë në nxjerrjen e qyteteve, monumenteve, madje edhe restoranteve dhe bareve nga të dhëna delikate vizuale.

Në shumë raste, modelet nuk duket se bazohen në “kujtime” të bisedave të kaluara ChatGPT, ose të dhëna EXIF, të cilat janë meta të dhënat e bashkangjitura në foto që zbulojnë detaje të tilla si vendi ku është bërë fotografia.

X është i mbushur me shembuj të përdoruesve që japin menutë e restoranteve ChatGPT, foto të lagjeve, fasada dhe autoportrete, dhe udhëzojnë o3 të imagjinojë se po luan “GeoGuessr”, një lojë online që sfidon lojtarët të hamendësojnë vendndodhjet nga imazhet e Google Street View.

Është një çështje e dukshme e mundshme e privatësisë. Nuk ka asgjë që e pengon një aktor të keq që të marrë pamje nga ekrani, të themi, Historinë e Instagramit të një personi dhe të përdorë ChatGPT për t’u përpjekur t’i përqendrojë ata.

Sigurisht, kjo mund të bëhet edhe para fillimit të o3 dhe o4-mini. TechCrunch realizoi një numër fotografish përmes o3 dhe një modeli më të vjetër pa aftësi të arsyetimit të imazhit, GPT-4o, për të krahasuar aftësitë e modeleve për të gjetur vendndodhjen. Çuditërisht, GPT-4o arriti në të njëjtën përgjigje të saktë si o3 më shpesh sesa jo – dhe mori më pak kohë.

Pati të paktën një rast gjatë testimit tonë të shkurtër kur o3 gjeti një vend që GPT-4o nuk mund ta bënte. Duke pasur parasysh një foto të një koke rinoceronti ngjyrë vjollce, të montuar në një bar me ndriçim të dobët, o3 u përgjigj saktë se ishte nga një foltore e Williamsburg – jo, siç mendoi GPT-4o, një pijetore në Mbretërinë e Bashkuar.

Kjo nuk do të thotë që o3 është i përsosur në këtë drejtim. Disa nga testet tona dështuan – o3 u mbërthye në një unazë, në pamundësi për të arritur në një përgjigje për të cilën kishte mjaft besim, ose doli vullnetarisht në një vendndodhje të gabuar. Përdoruesit në X vunë në dukje gjithashtu se o3 mund të jetë shumë larg në zbritjet e vendndodhjes së tij.

Por trendi ilustron disa nga rreziqet në zhvillim të paraqitura nga modelet më të afta, të ashtuquajturat arsyetim të AI. Duket se ka pak masa mbrojtëse për të parandaluar këtë lloj “kërkimi të kundërt të vendndodhjes” në ChatGPT dhe OpenAI, kompania që qëndron pas ChatGPT, nuk e trajton këtë çështje në raportin e saj të sigurisë për o3 dhe o4-mini.

Ne kemi kontaktuar me OpenAI për koment. Ne do të përditësojmë artikullin tonë nëse ata përgjigjen.

Përditësuar në 22:19 Paqësor: Disa orë pasi u publikua kjo histori, një zëdhënës i OpenAI i dërgoi TechCrunch deklaratën e mëposhtme:

“OpenAI o3 dhe o4-mini sjellin arsyetim vizual në ChatGPT, duke e bërë atë më të dobishëm në fusha të tilla si aksesueshmëria, kërkimi ose identifikimi i vendndodhjeve në përgjigjen e urgjencës. Ne kemi punuar për të trajnuar modelet tona për të refuzuar kërkesat për informacion privat ose delikat, kemi shtuar masa mbrojtëse që synojnë të ndalojnë modelin të identifikojë individë privatë në imazhe dhe të monitorojmë në mënyrë aktive politikat e privatësisë ndaj abuzimit me ne.”