Cloudflare krijon një kurth për AI

Sot, ne jemi të ngazëllyer të njoftojmë Labyrinthin e AI, një qasje të re zbutëse që përdor përmbajtje të krijuar nga AI për të ngadalësuar, ngatërruar dhe shpërdoruar burimet e Crawlers të AI dhe robotëve të tjerë që nuk respektojnë direktivat “pa zvarritje”. Kur zgjedhni, Cloudflare do të vendosë automatikisht një grup faqesh të lidhura të krijuara nga AI kur ne zbulojmë aktivitet të papërshtatshëm të robotëve, pa pasur nevojë që klientët të krijojnë ndonjë rregull të personalizuar.
AI Labyrinth është i disponueshëm në bazë të zgjedhjes për të gjithë klientët, përfshirë planin Falas.
Përmbajtja e gjeneruar nga inteligjenca artificiale ka shpërthyer, që thuhet se përbën katër nga 20 postimet më të mira në Facebook vjeshtën e kaluar. Për më tepër, Medium vlerëson se 47% e të gjithë përmbajtjes në platformën e tyre është krijuar nga AI. Si çdo mjet më i ri, ai ka përdorime të mrekullueshme dhe keqdashëse.
Në të njëjtën kohë, ne kemi parë gjithashtu një shpërthim të zvarritësve të rinj të përdorur nga kompanitë e AI për të grumbulluar të dhëna për trajnimin e modeleve. Zvarritësit e AI gjenerojnë më shumë se 50 miliardë kërkesa në rrjetin Cloudflare çdo ditë, ose pak më pak se 1% e të gjitha kërkesave në ueb që shohim. Ndërsa Cloudflare ka disa mjete për identifikimin dhe bllokimin e zvarritjes së paautorizuar të AI, ne kemi zbuluar se bllokimi i robotëve me qëllim të keq mund të paralajmërojë sulmuesin se jeni duke u drejtuar ndaj tyre, duke çuar në një ndryshim në qasje dhe një garë armësh të pafundme. Pra, ne donim të krijonim një mënyrë të re për të penguar këto robotë të padëshiruar, pa i lënë të kuptojnë se janë penguar.
Për ta bërë këtë, vendosëm të përdorim një mjet të ri fyes në grupin e mjeteve të krijuesit të robotëve, të cilin nuk e kemi parë të përdoret në mënyrë mbrojtëse: përmbajtje të krijuar nga AI. Kur zbulojmë zvarritje të paautorizuar, në vend që të bllokojmë kërkesën, ne do të lidhemi me një seri faqesh të krijuara nga AI që janë mjaft bindëse për të joshur një zvarritës t’i përshkojë ato. Por, megjithëse duket reale, kjo përmbajtje nuk është në të vërtetë përmbajtja e sajtit që ne mbrojmë, kështu që zvarritësi harxhon kohë dhe burime.
Si një përfitim shtesë, AI Labyrinth vepron gjithashtu si një honeypot i gjeneratës së ardhshme. Asnjë njeri i vërtetë nuk do të hynte katër hallka thellë në një labirint të marrëzive të krijuara nga AI. Çdo vizitor që e bën këtë ka shumë të ngjarë të jetë një bot, kështu që kjo na jep një mjet krejt të ri për të identifikuar dhe gjurmë gishtash robotët e këqij, të cilin ne e shtojmë në listën tonë të aktorëve të këqij të njohur. Ja si e bëjmë…
Kur zvarritësit e AI ndjekin këto lidhje, ata harxhojnë burime të vlefshme llogaritëse duke përpunuar përmbajtje të parëndësishme në vend që të nxjerrin të dhënat e ligjshme të faqes suaj të internetit. Kjo redukton ndjeshëm aftësinë e tyre për të mbledhur informacion të mjaftueshëm të dobishëm për të trajnuar modelet e tyre në mënyrë efektive.
Për të gjeneruar përmbajtje bindëse të ngjashme me njeriun, ne përdorëm Workers AI me një model me burim të hapur për të krijuar faqe unike HTML për tema të ndryshme. Në vend që ta krijojmë këtë përmbajtje sipas kërkesës (që mund të ndikojë në performancën), ne kemi zbatuar një tubacion para gjenerimit që pastron përmbajtjen për të parandaluar çdo dobësi XSS dhe e ruan atë në R2 për rikthim më të shpejtë. Ne zbuluam se gjenerimi i një grupi temash të larmishëm fillimisht, më pas krijimi i përmbajtjes për secilën temë, prodhoi rezultate më të larmishme dhe bindëse. Është e rëndësishme për ne që të mos gjenerojmë përmbajtje të pasaktë që kontribuojnë në përhapjen e dezinformatave në internet, kështu që përmbajtja që gjenerojmë është reale dhe e lidhur me fakte shkencore, thjesht jo relevante ose pronësore për faqen që po zvarritet.
Kjo përmbajtje e krijuar paraprakisht integrohet pa ndërprerje si lidhje të fshehura në faqet ekzistuese nëpërmjet procesit tonë të personalizuar të transformimit të HTML, pa prishur strukturën ose përmbajtjen origjinale të faqes. Çdo faqe e krijuar përfshin meta direktiva të përshtatshme për të mbrojtur SEO duke parandaluar indeksimin e motorit të kërkimit. Ne gjithashtu siguruam që këto lidhje të mbeten të padukshme për vizitorët njerëzorë përmes atributeve dhe stileve të zbatuara me kujdes. Për të minimizuar më tej ndikimin tek vizitorët e rregullt, ne siguruam që këto lidhje të prezantohen vetëm për gërvishtësit e dyshuar të AI, duke lejuar përdoruesit legjitimë dhe zvarritësit e verifikuar të shfletojnë normalisht.

Ajo që e bën këtë qasje veçanërisht efektive është roli i saj në sistemin tonë të zbulimit të robotëve në zhvillim të vazhdueshëm. Kur ndiqen këto lidhje, ne e dimë me besim të lartë se është një aktivitet i automatizuar i zvarritësit, pasi vizitorët njerëzorë dhe shfletuesit legjitimë nuk do t’i shihnin apo klikonin kurrë. Kjo na siguron një mekanizëm të fuqishëm identifikimi, duke gjeneruar të dhëna të vlefshme që ushqehen në modelet tona të mësimit të makinerive. Duke analizuar se cilët zvarritës po ndjekin këto shtigje të fshehura, ne mund të identifikojmë modele dhe nënshkrime të reja bot që përndryshe mund të mos zbulohen. Kjo qasje proaktive na ndihmon të qëndrojmë përpara krueseve të AI, duke përmirësuar vazhdimisht aftësitë tona të zbulimit pa ndërprerë përvojën normale të shfletimit.
Duke ndërtuar këtë zgjidhje në platformën tonë të zhvilluesve, ne kemi krijuar një sistem që shërben menjëherë në përmbajtje bindëse mashtrimi duke ruajtur cilësinë e qëndrueshme – të gjitha pa ndikuar në performancën e faqes suaj ose përvojën e përdoruesit.
Aktivizimi i AI Labyrinth është i thjeshtë dhe kërkon vetëm një ndërrim të vetëm në pultin tuaj të Cloudflare. Navigoni te seksioni i menaxhimit të robotëve brenda zonës suaj dhe aktivizoni cilësimin e ri të Labyrinthit të AI në:


Pasi të aktivizohet, Labyrinth i AI fillon të funksionojë menjëherë pa nevojë për konfigurim shtesë.
Përfitimi kryesor i Labyrinthit të AI është ngatërrimi dhe shpërqendrimi i robotëve. Megjithatë, një përfitim dytësor është të shërbejë si një honeypot i gjeneratës së ardhshme. Në këtë kontekst, një honeypot është thjesht një lidhje e padukshme që një vizitor i faqes në internet nuk mund ta shohë, por një bot që analizon HTML-në do ta shihte dhe do të klikonte mbi të, pra duke u shfaqur si një bot. Honeypots janë përdorur për të kapur hakerat që në fund të incidentit të Cuckoo’s Egg të vitit 1986. Dhe në vitin 2004, Projekti Honeypot u krijua nga themeluesit e Cloudflare (para themelimit të Cloudflare) për t’i lejuar të gjithë të vendosin me lehtësi honeypot-e me email falas dhe të marrin lista të IP-ve të zvarritësve në këmbim të kontributit në bazën e të dhënave. Por ndërsa robotët kanë evoluar, ata tani kërkojnë në mënyrë proaktive teknika honeypot si lidhjet e fshehura, duke e bërë këtë qasje më pak efektive.
Labyrinth i AI nuk do të shtojë thjesht lidhje të padukshme, por përfundimisht do të krijojë rrjete të tëra URL-sh të lidhura që janë shumë më realiste dhe jo të parëndësishme që programet e automatizuara të dallohen. Përmbajtja në faqe është padyshim e përmbajtjes që asnjë njeri nuk do të harxhonte kohë, por robotët e AI janë programuar të zvarriten mjaft thellë për të mbledhur sa më shumë të dhëna të jetë e mundur. Kur robotët godasin këto URL, mund të jemi të sigurt se ata nuk janë njerëz të vërtetë dhe ky informacion regjistrohet dhe futet automatikisht në modelet tona të mësimit të makinerive për të ndihmuar në përmirësimin e identifikimit tonë të robotëve. Kjo krijon një lak të dobishëm reagimesh ku çdo përpjekje për gërvishtje ndihmon në mbrojtjen e të gjithë klientëve të Cloudflare.
Ky është vetëm përsëritja e parë e përdorimit të AI gjeneruese për të penguar robotët për ne. Aktualisht, ndërsa përmbajtja që ne gjenerojmë është bindëse njerëzore, ajo nuk do të përputhet me strukturën ekzistuese të çdo faqe interneti. Në të ardhmen, ne do të vazhdojmë të punojmë për t’i bërë këto lidhje më të vështira për t’u dalluar dhe për t’i bërë ato të përshtaten pa probleme në strukturën ekzistuese të faqes së internetit ku janë të integruara. Mund të na ndihmoni duke zgjedhur tani.