Reddit bllokon Wayback Machine të Internet Archive nga grumbullimi i të dhënave të tij

foto

Reddit ka bllokuar Wayback Machine të Internet Archive nga indeksimi i pjesës më të madhe të përmbajtjes së saj, duke cituar prova se firmat e inteligjencës artificiale po e përdorin atë për të anashkaluar tarifat e licencimit dhe për të mbledhur të dhënat e përdoruesve.

foto

Konflikti midis platformave të përmbajtjes dhe kompanive të inteligjencës artificiale po intensifikohet. Në kthesën e fundit të ngjarjeve, platforma dhe forumi i njohur i mediave sociale Reddit pretendoi se kompanitë e inteligjencës artificiale kanë mbledhur të dhënat e saj nga Wayback Machine i Internet Archive. Dhe, në përgjigje, platforma ka njoftuar se po fillon të bllokojë Internet Archive nga indeksimi i shumicës së përmbajtjes së saj. Kjo do të thotë që Wayback Machine nuk do të jetë në gjendje të zvarrit postimet, komentet ose detajet e profilit të përdoruesve. Megjithatë, kompania do të lejojë që mjeti të zvarritet në faqen e saj kryesore, Reddit.com. Kjo do të thotë që Internet Archive do të jetë në gjendje të arkivojë vetëm përmbajtjen e dukshme në faqen kryesore.

foto

Zhvillimi po zhvillohet në një kohë kur Reddit po forcon kontrollin e saj mbi të dhënat e përdoruesve. Anasjelltas, Reddit nuk është kundër firmave të inteligjencës artificiale që trajnojnë modelet e tyre bazuar në postimet e saj, por ato do të detyrohen të paguajnë të parat. Më parë, platforma kishte thënë se nuk do të përmbajë “aktorë me besim të mirë” siç është Internet Archive. Megjithatë, tani ajo ka ndryshuar qëndrimin e saj pasi ka ndjerë se disa po ndihmojnë firmat e inteligjencës artificiale të anashkalojnë tarifat e licencës. Kompania e mediave sociale ka pretenduar se ka prova se disa firma të inteligjencës artificiale po manipulojnë Wayback Machine për të shmangur politikat e saj dhe për të mbledhur përmbajtjen e përdoruesve.

E themeluar në vitin 1996, Arkivi i Internetit është një organizatë jofitimprurëse me seli në SHBA që operon faqen e internetit të bibliotekës dixhitale archive.org. Platforma ofron qasje falas në një sërë mediash të dixhitalizuara, duke përfshirë faqet e internetit, aplikacionet softuerike, muzikën, materialet audiovizuale dhe të shtypura. Organizata është mbështetëse e një interneti të lirë dhe të hapur, që do të thotë se është e përkushtuar të ofrojë qasje universale në të gjitha njohuritë.

Ndërsa përdoruesit nga kudo mund të ngarkojnë ose shkarkojnë materiale dixhitale nga grupet e të dhënave të saj, një shumicë dërrmuese e të dhënave të saj mblidhen automatikisht përmes programeve të saj të kërkimit në internet që punojnë për të ruajtur sa më shumë përmbajtje publike të jetë e mundur.

Arkivi i Internetit u themelua nga Brewster Kahle, një inxhinier kompjuterash dhe sipërmarrës. Arkivi i Internetit lindi nga dëshira e tij për të krijuar një regjistër gjithëpërfshirës dhe të aksesueshëm publikisht të internetit. Pjesa më e madhe e motivimit të Kahle mund të gjendet në mesin e viteve 1990, kur ai pa se sa shpejt zhdukej përmbajtja. Ai pa që faqet e internetit do të zhdukeshin pas ridizajnimit, serverët mund të dilnin jashtë linje dhe nuk kishte të dhëna historike të veprave të hershme dixhitale. Kjo ishte gjithashtu koha kur ai po bënte një pasuri duke shitur kompaninë e tij të kërkimit në internet WAIS te AOL.

Kahle donte që ky informacion të ishte i disponueshëm për brezat e ardhshëm për ta studiuar dhe referuar. Ai ka qenë një avokat afatgjatë i aksesit të lirë dhe të qëndrueshëm në njohuritë njerëzore. Arkivi i Internetit është i famshëm për Wayback Machine. Kahle gjithashtu donte të ruante librat, audion, videon, softuerët dhe formatet e tjera të videos dixhitale, duke i mbrojtur ato në thelb nga dëmtimet fizike. Kahle arriti në kuptimin se pavarësisht nga pafundësia e tij, interneti është i brishtë dhe pa ruajtje aktive, shumica e tij mund të zhduket në çdo kohë.

“Mundësia që kemi përpara është të jetojmë ëndrrën e Bibliotekës së Aleksandrisë dhe pastaj ta çojmë një hap më tej – qasje universale në të gjitha njohuritë. Është interesante se tani është teknikisht e realizueshme”, citohet të ketë thënë Kahle nga shumë botime mediatike. Sipas bibliotekarit dixhital, Arkivi i Internetit nuk është vetëm një bibliotekë ose arkiv, por edhe një mbrojtje kulturore. Është në thelb një mënyrë për të siguruar që njohuria të vazhdojë pavarësisht ndryshimeve teknologjike.

Wayback Machine është një arkiv dixhital i themeluar nga Internet Archive. U lançua në vitin 2001 dhe në thelb ofron një mjet për përdoruesit për të parë se si dukeshin faqet e internetit ose përmbajtja dixhitale në të kaluarën. Kahle e zhvilloi atë për të ofruar qasje në njohuri universale, pasi mjeti ruan kopje të arkivuara të faqeve të internetit dhe faqeve të internetit që tani nuk ekzistojnë. Që nga sot, përdoruesit mund të eksplorojnë mbi 866 miliardë faqe interneti që janë ruajtur me kalimin e kohës.

Softueri i Wayback Machine është zhvilluar për të shfletuar uebin dhe për të shkarkuar të gjitha informacionet dhe skedarët e të dhënave të disponueshme publikisht në faqet e internetit. Megjithatë, informacioni i mbledhur nga shfletuesit nuk përfshin të gjithë përmbajtjen, pasi të dhënat janë të kufizuara nga botuesit ose bazat e të dhënave janë të paarritshme. I kufizuar nga bazat e të dhënave të ruajtura pjesërisht në memorje, Internet Archive prezantoi Archive-It.org për t’u mundësuar institucioneve dhe krijuesve të ruajnë vullnetarisht përmbajtjen dixhitale. Kur bëhet fjalë për kapacitetin e ruajtjes, Wayback Machine filloi me 12 terabajt në muaj, me raftin e parë prej 100 TB që u vu në funksion në vitin 2004 për të grumbulluar mbi 100 petabajt të dhëna deri në nëntor 2024.

Ndërkohë që ka qenë në përputhje me standardin e përjashtimit të robots.txt dhe ka hequr edhe faqet e arkivuara më parë kur janë bllokuar, në vitin 2017 ajo ka ndryshuar drejtimin drejt kërkesave të qarta për heqje. Sipas raportimeve, afërsisht në të njëjtën kohë, ajo filloi të anashkalonte robot.txt në faqet e qeverisë dhe ushtrisë amerikane, gjë që çoi në një zgjerim të mëvonshëm të politikës.

Që nga lançimi i saj, Wayback Machine është përdorur gjerësisht nga studiues, studiues dhe gazetarë për të hyrë në faqet e mbyllura, për të ndjekur ndryshimet e përmbajtjes dhe për t’i mbajtur figurat përgjegjëse. Sipas raportimeve, redaktorët e Wikipedia-s e përdorin atë shumë për ruajtjen e citimeve dhe ka partneritete të tilla si integrimi i Cloudflare 2020 që lejon arkivimin automatik për faqet që janë gjithmonë në internet.

Ka pasur mosmarrëveshje të shumta ligjore në lidhje me Wayback Machine, veçanërisht vendime të përziera gjyqësore mbi pranueshmërinë e arkivave të saj si prova. Sipas raportimeve, disa zyra patentash në SHBA dhe Evropë i pranojnë vulat e saj kohore si provë të artit paraprak. Janë bërë gjithashtu sfida ligjore për shkak të pretendimeve për privatësi dhe të drejta autoriale. Pavarësisht rezervës së saj të gjerë informacioni, Wayback Machine është gjithashtu i prekur nga censura dhe kufizimet e aksesit. Për shembull, archive.org është bllokuar në Kinë, është bllokuar përkohësisht në Rusi dhe ka qenë dëshmitare e kërkesave për heqje nga qeveritë dhe korporatat.