New York Times dhe faqet e tjera kryesore të lajmeve bllokojnë robotin e ri të kërkimit të internetit SearchGPT të OpenAI

foto

Rreth një javë pasi OpenAI lançoi SearchGPT, disa nga botuesit kryesorë të lajmeve e kanë bërë të qartë se nuk duan të bëjnë asgjë me motorin e ri të kërkimit të startup-it.

foto

New York Times dhe të paktën 13 faqe të tjera lajmesh kanë bllokuar OAI-SearchBot. Ky është zvarritësi i uebit që indekson informacionin në mënyrë që OpenAI të mund të marrë dhe të tregojë rezultatet përkatëse për përdoruesit e SearchGPT.

foto

Originality.ai gjurmon këto gjëra dhe zbuloi se 14 nga 1000 botuesit kryesorë të faqeve të internetit kanë bllokuar OAI-SearchBot. Publikime të tjera në listë përfshijnë Wired, The New Yorker, Vogue, Vanity Fair dhe GQ.

Kjo është pak gërvishtëse, sipas Jon Gillham, CEO i Originality.ai.

“Nuk jam i sigurt pse ndonjë botues do ta bllokonte atë”, tha ai për Business Insider. “Është trafiku që botuesit duan dhe kanë nevojë.”

Kur OpenAI zbuloi SearchGPT javën e kaluar, theksoi se OAI-SearchBot nuk zvarritet në ueb për të mbledhur të dhëna për të trajnuar modelet e tij të AI si GPT-5. Dhe këshilloi pronarët e faqeve të internetit që të lejojnë robotin e ri të “sigurojë që faqja juaj të shfaqet në rezultatet e kërkimit”.

Pa akses me rrëshqitës në çdo faqe interneti, shërbimet SearchGPT të OpenAI rrezikojnë të jenë më pak të plota se motori i kërkimit i Google. BI e pyeti Gillhamin nëse ndonjë botues i madh lajmesh bllokon robotin e kërkimit të Google dhe ai tha se nuk dinte ndonjë që e bënte këtë.

Ekziston një tjetër zvarritës ueb OpenAI, i quajtur GPTbot, që mbledh të dhëna në internet për trajnimin e modelit të AI. Qindra faqe interneti e kanë bllokuar tashmë këtë. Kjo ka më shumë kuptim: Ju dëshironi trafik nga motorët e kërkimit, por nuk dëshironi të jepni përmbajtjen tuaj për të trajnuar modele të AI që ka të ngjarë të konkurrojnë kundër jush.

Sidoqoftë, OpenAI kaloi vite duke mbledhur të dhëna në internet pa leje. Ndoshta botuesit thjesht nuk i besojnë OpenAI-t kur thotë se roboti i ri i kërkimit nuk do të thithë fshehurazi përmbajtjen e tyre për të dhënat e trajnimit të AI?

“Unë mendoj kështu,” tha Gillham.

Një tjetër teori: Rezultatet e kërkimit këto ditë nuk i dërgojnë gjithmonë përdoruesit në faqet e internetit që kanë punuar shumë për të krijuar përmbajtjen origjinale. Një pjesë e qëllimit me motorët e rinj të kërkimit të fuqizuar nga AI është t’i mbani përdoruesit përreth duke u treguar atyre përmbledhje. Nëse botuesit nuk po shohin më trafik të madh nga motorët e kërkimit, pse të shqetësoheni të lejoni robotët e tyre që zvarriten në ueb?

Gillham gjithashtu vuri në dukje se OpenAI ka qenë i zënë këtë vit duke shkurtuar marrëveshje me botuesit për të përdorur arkivat e tyre të përmbajtjes. (Prindi i Business Insider Axel Springer nënshkroi një nga këto .)

“Duket sikur ishte një sekuencë e qëllimshme hapash me OpenAI, së pari komod për botuesit që nënshkruajnë të gjitha këto marrëveshje partneriteti dhe më pas shpallin SearchGPT,” shtoi Gillham.

Mbështetja kryesore midis botuesve është The New York Times. Ajo ka paditur OpenAI dhe Microsoft, duke pretenduar se kompanitë e teknologjisë përdorin në mënyrë të paligjshme punën e saj për të krijuar produkte konkurruese.

“The Times nuk autorizon përdorimin e veprave tona për qëllime të kërkimit gjenerues ose trajnimit të AI pa një marrëveshje të shprehur me shkrim, pavarësisht nëse ne bllokojmë apo nuk kufizojmë ndonjë robot të veçantë nga zvarritja e përmbajtjes sonë,” Charlie Stadtlander, një zëdhënës për “New York Times”, thuhet në një deklaratë.

Në ankesën e saj kundër OpenAI dhe Microsoft, The New York Times preku këtë çështje të motorëve të kërkimit që po fuqizohen më shumë nga AI dhe potencialisht largojnë trafikun nga botuesit.

“Të pandehurit përdorin gjithashtu indeksin e kërkimit Bing të Microsoft, i cili kopjon dhe kategorizon përmbajtjen në internet të The Times, për të gjeneruar përgjigje që përmbajnë fragmente fjalë për fjalë dhe përmbledhje të detajuara të artikujve të Times që janë dukshëm më të gjata dhe më të detajuara se ato të kthyera nga motorët tradicionalë të kërkimit,” shkroi botuesi. në ankesën e saj. “Duke ofruar përmbajtje të Times pa lejen ose autorizimin e The Times, mjetet e të pandehurve minojnë dhe dëmtojnë marrëdhëniet e The Times me lexuesit e saj dhe privojnë The Times nga abonimi, licencimi, reklamimi dhe të ardhurat e filialeve.”