Perplexity akuzohet për grumbullim të përmbajtjes nga faqe që kishin bllokuar në mënyrë të qartë grumbullimin nga AI

Startup-i i inteligjencës artificiale Perplexity po zvarrit dhe mbledh përmbajtje nga faqet e internetit që kanë treguar në mënyrë të qartë se nuk duan të mblidhen, sipas ofruesit të infrastrukturës së internetit Cloudflare.

Të hënën, Cloudflare publikoi një studim ku thuhej se kishte vërejtur se startup-i i inteligjencës artificiale i injoronte blloqet dhe fshihte aktivitetet e tij të zvarritjes dhe mbledhjes së të dhënave. Gjigandi i infrastrukturës së rrjetit akuzoi Perplexity për errësimin e identitetit të tij kur përpiqej të mblidhte faqe interneti “në një përpjekje për të anashkaluar preferencat e faqes së internetit”, shkruan studiuesit e Cloudflare.

Produktet e inteligjencës artificiale si ato të ofruara nga Perplexity mbështeten në përthithjen e sasive të mëdha të të dhënave nga interneti, dhe startup-et e inteligjencës artificiale kanë mbledhur prej kohësh tekst, imazhe dhe video nga interneti shumë herë pa leje që produktet e tyre të funksionojnë. Kohët e fundit, faqet e internetit janë përpjekur të kundërveprojnë duke përdorur skedarin standard të internetit Robots.txt, i cili u tregon motorëve të kërkimit dhe kompanive të inteligjencës artificiale se cilat faqe mund të indeksohen dhe cilat jo, përpjekje që deri më tani kanë parë rezultate të përziera.
Perplexity duket se po i anashkalon me dëshirë këto bllokime duke ndryshuar “agjentin e përdoruesit” të botëve të saj, që do të thotë një sinjal që identifikon një vizitor të faqes së internetit sipas pajisjes dhe llojit të versionit të tyre, si dhe duke ndryshuar rrjetet e tyre të sistemit autonom, ose ASN, në thelb një numër që identifikon rrjetet e mëdha në internet, sipas Cloudflare.
“Ky aktivitet u vu re në dhjetëra mijëra domene dhe miliona kërkesa në ditë. Ne ishim në gjendje të identifikonim gjurmët e gishtave të këtij programi zvarritës duke përdorur një kombinim të të mësuarit automatik dhe sinjaleve të rrjetit”, thuhej në postimin e Cloudflare.
Zëdhënësi i Perplexity, Jesse Dwyer, e hodhi poshtë postimin në blog të Cloudflare si një “premtim shitjesh”, duke shtuar në një email drejtuar TechCrunch se pamjet e ekranit në postim “tregojnë se nuk është aksesuar asnjë përmbajtje”. Në një email pasues, Dwyer pretendoi se boti i përmendur në blogun e Cloudflare “nuk është as i yni”.
Cloudflare tha se e vuri re për herë të parë sjelljen pasi klientët e saj u ankuan se Perplexity po zvarritej dhe po kontrollonte faqet e tyre, edhe pasi ata shtuan rregulla në skedarin e tyre Robots dhe për bllokimin specifik të botëve të njohur të Perplexity. Cloudflare tha se më pas kreu teste për të kontrolluar dhe konfirmuar se Perplexity po i anashkalonte këto bllokime.
“Ne vumë re se Perplexity përdor jo vetëm agjentin e tyre të deklaruar të përdoruesit, por edhe një shfletues të përgjithshëm që synon të imitojë Google Chrome në macOS kur shfletuesi i tyre i deklaruar ishte bllokuar”, sipas Cloudflare.
Kompania tha gjithashtu se i ka hequr botët e Perplexity nga lista e saj e verifikuar dhe ka shtuar teknika të reja për t’i bllokuar ato.
Cloudflare kohët e fundit ka mbajtur një qëndrim publik kundër programeve crawler të inteligjencës artificiale. Muajin e kaluar, Cloudflare njoftoi lançimin e një tregu që u lejon pronarëve të faqeve të internetit dhe botuesve të faturojnë programet crawler të inteligjencës artificiale që vizitojnë faqet e tyre. Drejtori ekzekutiv i Cloudflare, Matthew Prince, dha alarmin në atë kohë, duke thënë se inteligjenca artificiale po shkatërron modelin e biznesit të internetit, veçanërisht botuesit. Vitin e kaluar, Cloudflare lançoi gjithashtu një mjet falas për të parandaluar që robotët të skruajnë faqet e internetit për të trajnuar inteligjencën artificiale.
Kjo nuk është hera e parë që Perplexity akuzohet për vjedhje pa autorizim.
Vitin e kaluar, mediat, si Wired, pretenduan se Perplexity po plagjiatonte përmbajtjen e tyre. Javë më vonë, CEO i Perplexity, Aravind Srinivas, nuk ishte në gjendje të përgjigjej menjëherë kur iu kërkua të jepte përkufizimin e kompanisë për plagjiaturën gjatë një interviste me Devin Coldewey të TechCrunch në konferencën Disrupt 2024.