Kompanitë e inteligjencës artificiale janë ende duke gërvishtur faqet e internetit pavarësisht protokolleve që synojnë t’i bllokojnë ato

foto

Shumë kompani të inteligjencës artificiale po anashkalojnë një standard të përbashkët ueb të përdorur nga botuesit për të bllokuar gërvishtjen e përmbajtjes së tyre për përdorim në sistemet gjeneruese të AI, u ka thënë botuesve startupi i licencimit të përmbajtjes TollBit.

foto

Një letër drejtuar botuesve të parë nga Reuters të premten, e cila nuk përmend kompanitë e inteligjencës artificiale ose botuesit e prekur, vjen në mes të një mosmarrëveshjeje publike midis startup-it të kërkimit të AI Perplexity dhe medias Forbes që përfshin të njëjtin standard ueb dhe një debat më të gjerë midis firmave të teknologjisë dhe medias. mbi vlerën e përmbajtjes në epokën e AI gjeneruese.

foto

Botuesi i mediave të biznesit akuzoi publikisht Perplexity për plagjiaturë të historive të saj investigative në përmbledhjet e krijuara nga AI pa cituar Forbes ose pa kërkuar lejen e tij.

Një hetim Wired i publikuar këtë javë zbuloi se Perplexity ka të ngjarë të anashkalojë përpjekjet për të bllokuar zvarritësin e saj të internetit nëpërmjet Protokollit të Përjashtimit të Robots, ose “robots.txt”, një standard i pranuar gjerësisht që synon të përcaktojë se cilat pjesë të një faqeje lejohen të zvarriten.

Perplexity refuzoi një kërkesë të Reuters për koment mbi mosmarrëveshjen.

News Media Alliance, një grup tregtar që përfaqëson më shumë se 2200 botues me bazë në SHBA, shprehu shqetësimin për ndikimin që mund të ketë tek anëtarët e saj injorimi i sinjaleve “mos zvarrit”.

“Pa aftësinë për të hequr dorë nga grumbullimi masiv, ne nuk mund të fitojmë para nga përmbajtjet tona të vlefshme dhe të paguajmë gazetarët. Kjo mund të dëmtojë seriozisht industrinë tonë,” tha Danielle Coffey, presidente e grupit.

TollBit, një startup në fazat e hershme, po pozicionohet si një krijues mblesëri midis kompanive të inteligjencës artificiale të uritur për përmbajtje dhe botuesve të hapur ndaj marrëveshjeve goditëse të licencimit me to.

Kompania gjurmon trafikun e AI në faqet e internetit të botuesve dhe përdor analitikë për të ndihmuar të dyja palët të vendosin për tarifat që duhet të paguhen për përdorimin e llojeve të ndryshme të përmbajtjes.

Për shembull, botuesit mund të zgjedhin të vendosin tarifa më të larta për “përmbajtjen premium, të tilla si lajmet më të fundit ose njohuritë ekskluzive”, thotë kompania në faqen e saj të internetit.

Ai thotë se kishte 50 faqe interneti të drejtpërdrejta që nga maji, megjithëse nuk i ka emëruar ato.

Sipas letrës së TollBit, Perplexity nuk është i vetmi shkelës që duket se po injoron robots.txt.

TollBit tha se analitika e tij tregon se agjentë “të shumtë” të AI po anashkalojnë protokollin, një mjet standard i përdorur nga botuesit për të treguar se cilat pjesë të faqes së tij mund të zvarriten.

“Çfarë do të thotë kjo në terma praktike është se agjentët e AI nga burime të shumta (jo vetëm një kompani) po zgjedhin të anashkalojnë protokollin robots.txt për të tërhequr përmbajtjen nga faqet,” shkroi TollBit. “Sa më shumë regjistra të botuesve të marrim, aq më shumë shfaqet ky model.”

Protokolli robots.txt u krijua në mesin e viteve 1990 si një mënyrë për të shmangur mbingarkimin e faqeve të internetit me zvarritës të uebit. Megjithëse nuk ka një mekanizëm të qartë të zbatimit ligjor, historikisht ka patur një pajtueshmëri të gjerë në internet dhe disa grupe – duke përfshirë News Media Alliance – thonë se mund të ketë ende rekurs ligjor për botuesit.

Kohët e fundit, robots.txt është bërë një mjet kyç që kanë përdorur botuesit për të bllokuar kompanitë e teknologjisë që të gëlltisin përmbajtjen e tyre pa pagesë për përdorim në sistemet gjeneruese të AI që mund të imitojnë krijimtarinë njerëzore dhe të përmbledhin menjëherë artikujt.

Kompanitë e AI përdorin përmbajtjen për të trajnuar algoritmet e tyre dhe për të gjeneruar përmbledhje të informacionit në kohë reale.

Disa botues, duke përfshirë New York Times, kanë paditur kompanitë e AI për shkelje të të drejtave të autorit mbi këto përdorime. Të tjerët po nënshkruajnë marrëveshje licencimi me kompanitë e AI të hapura për të paguar për përmbajtjen, megjithëse palët shpesh nuk pajtohen për vlerën e materialeve. Shumë zhvillues të AI argumentojnë se nuk kanë shkelur asnjë ligj për t’i aksesuar ato falas.

Thomson Reuters, pronari i Reuters News, është ndër ata që kanë arritur marrëveshje për të licencuar përmbajtjen e lajmeve për përdorim nga modelet e AI.

Botuesit kanë ngritur alarmin në lidhje me përmbledhjet e lajmeve në veçanti që kur Google nxori një produkt vitin e kaluar që përdor AI për të krijuar përmbledhje në përgjigje të disa pyetjeve të kërkimit.

Nëse botuesit duan të parandalojnë përdorimin e përmbajtjes së tyre nga AI i Google për të ndihmuar në gjenerimin e atyre përmbledhjeve, ata duhet të përdorin të njëjtin mjet që do t’i parandalonte ata të shfaqen në rezultatet e kërkimit të Google, duke i bërë ato praktikisht të padukshme në ueb.