Shumë nga faqet e internetit më të mëdha kanë hequr dorë nga trajnimi i Apple Intelligence

foto

Sistemet gjeneruese të AI trajnohen duke i lënë të shfletojnë në ueb për të gërvishtur përmbajtjen. Apple i lejon botuesit të zgjedhin skrapimin e tij dhe një raport i ri thotë se shumë nga faqet e internetit më të mëdha kanë hequr dorë nga trajnimi i Apple Intelligence.

foto

Kjo përfshin Facebook dhe Instagram, si dhe shumë faqe të profilit të lartë të lajmeve dhe mediave si The New York Times dhe The Atlantic.

foto

Modele të mëdha gjuhësore si ChatGPT trajnohen duke u dhënë atyre akses në miliona fjalë të materialit burimor, duke filluar nga lajmet deri te komentet e përdoruesve.

Në rastin e Apple, kompania ka vite që përdor Applebot për të trajnuar Siri-n dhe për të shfaqur sugjerimet e Spotlight. Kohët e fundit, kompania ka përdorur gjithashtu Applebot për të trajnuar Apple Intelligence.

Praktika është e diskutueshme, pasi AI-të po përdorin në mënyrë efektive materialin me të drejtë autori për të gjeneruar versionet e tyre të tij. Për më shumë tema të veçanta, ku materiali burimor është i pakët, ato madje janë gjetur të rikthejnë paragrafë të tërë pa pothuajse asnjë ndryshim.

Por Apple e bën këtë në një mënyrë etike , duke i lejuar botuesit të zgjedhin dhe të kontrollojnë të dhënat personale (megjithëse u kap nga një burim i palës së tretë).

Ne trajnojmë modelet tona të fondacionit mbi të dhënat e licencuara, duke përfshirë të dhënat e zgjedhura për të përmirësuar veçoritë specifike, si dhe të dhënat e disponueshme publikisht të mbledhura nga aplikacioni ynë i uebit, AppleBot. Botuesit në ueb kanë mundësinë të heqin dorë nga përdorimi i përmbajtjes së tyre të internetit për trajnimin e Apple Intelligence me një kontroll të përdorimit të të dhënave […]

Ne aplikojmë filtra për të hequr informacionin personalisht të identifikueshëm si numrat e sigurimeve shoqërore dhe kartat e kreditit që janë të disponueshëm publikisht në internet.

Apple përdor një etiketë Applebot-Extended për të lejuar faqet të tërhiqen nga trajnimi i AI duke lejuar ende indeksimin e kërkimit – që do të thotë se pjesët e tyre mund të përfshihen ende në kërkimet Spotlight dhe Siri.

Meqenëse përjashtimi bëhet duke përdorur një skedar robots.txt të aksesueshëm publikisht, është e lehtë të shihet se cilat sajte e kanë bërë këtë. Wired kontrolloi një numër prej faqeve më të mëdha të lajmeve dhe mediave sociale.

WIRED mund të konfirmojë se Facebook, Instagram, Craigslist, Tumblr, The New York Times, The Financial Times, The Atlantic, Vox Media, rrjeti USA Today dhe kompania mëmë e WIRED, Condé Nast, janë ndër shumë organizata që zgjedhin të përjashtojnë të dhënat e tyre nga trajnimi i AI i Apple […]

Në një analizë të veçantë të kryer këtë javë, gazetari i të dhënave Ben Welsh zbuloi se pak më shumë se një e katërta e faqeve të lajmeve që ai anketoi (294 nga 1,167 kryesisht botime në gjuhën angleze, me bazë në SHBA) po bllokojnë Applebot-Extended.

Apple besohet se ka arritur marrëveshje me disa kompani mediatike, duke paguar një tarifë në këmbim të së drejtës për të përdorur përmbajtjen e tyre për trajnime. Ka të ngjarë që ky të jetë motivimi për të paktën disa sajte që aktualisht bllokojnë Apple – duke qëndruar në pritje për një ofertë pagese.

Pothuajse kurrë nuk do të gaboni duke zbatuar parimin “ndiq paratë”. Thënë kështu, nuk jam i sigurt se ndonjë faqe interneti apo edhe koleksion uebsajtesh ka aq rëndësi jashtë fushave të specializuara si mjekësia.

Ne aplikojmë filtra për të hequr informacionin personalisht të identifikueshëm si numrat e sigurimeve shoqërore dhe kartat e kreditit që janë të disponueshëm publikisht në internet.

Me të gjitha rrjedhjet e të dhënave që ndodhin, kjo është mirë të dihet. Ofruesi im aktual i faqes time të internetit u përpoq të më detyronte një tarifë rinovimi prej 500 dollarësh, pa ndonjë njoftim paraprak. U hodh sepse numrat e kartës sime të kreditit kishin ndryshuar dhe ata nuk mund ta marrin të riun. Kjo më lë në vendin e shoferit. Ata ishin një ofrues i mirë përpara se një firmë investimi me “vlerë aksionere” t’i merrte përsipër, duke ulur shërbimet dhe duke rritur çmimet. Shpëtim i mirë!

Applebot-Extended është një etiketë relativisht e re, kështu që ka të ngjarë që më shumë uebfaqe të tërhiqen pasi të rritet ndërgjegjësimi.

Apple besohet se ka arritur marrëveshje me disa kompani mediatike, duke paguar një tarifë në këmbim të së drejtës për të përdorur përmbajtjen e tyre për trajnime. Ka të ngjarë që ky të jetë motivimi për të paktën disa sajte që aktualisht bllokojnë Apple – duke qëndruar në pritje për një ofertë pagese.

“Shumë nga botuesit më të mëdhenj në botë po marrin qartë një qasje strategjike,” thotë themeluesi i Originality AI Jon Gillham. “Unë mendoj se në disa raste, ka një strategji biznesi të përfshirë – si, mbajtja e të dhënave derisa të arrihet një marrëveshje partneriteti.”