Fillimi i videove me inteligjencë artificiale Runway thuhet se është trajnuar në mijëra video në YouTube pa leje
Kompania e inteligjencës artificiale Runway thuhet se ka fshirë “mijëra” video në YouTube dhe versione pirate të filmave me të drejtë autori pa leje. 404 Media mori fletëllogaritëse të brendshme të supozuara që sugjeronin se startup-i që gjeneron video me AI trajnoi modelin e tij Gen-3 duke përdorur përmbajtje në YouTube nga kanale si Disney, Netflix, Pixar dhe media të njohura.
Një ish-punonjës i dyshuar i “Runway” i tha botimit se kompania përdori fletëllogaritën për të shënuar listat e videove që donte në bazën e të dhënave të saj. Më pas do t’i shkarkonte ato pa u zbuluar duke përdorur softuer proxy me burim të hapur për të mbuluar gjurmët e tij. Një fletë liston fjalë kyçe të thjeshta si astronaut, zanë dhe ylber, me fusnota që tregojnë nëse kompania kishte gjetur video përkatëse me cilësi të lartë për t’u stërvitur. Për shembull, termi “superhero” përfshin një shënim që lexon, “Shumë klipe filmash”. (Me të vërtetë.)
Shënime të tjera tregojnë kanalet e YouTube të shënuara nga Runway për Unreal Engine, regjisorin Josh Neuman dhe një faqe fansash të Call of Duty si burime të mira për videot e trajnimit “me lëvizje të lartë”.
“Kanalet në atë fletëllogaritëse ishin një përpjekje e gjerë e kompanisë për të gjetur video me cilësi të mirë për të ndërtuar modelin,” tha ish-punonjësi për 404 Media. “Kjo u përdor më pas si hyrje për një zvarritës masiv të uebit i cili shkarkonte të gjitha videot nga të gjitha ato kanale, duke përdorur proxies për të shmangur bllokimin nga Google.”
Një listë me rreth 4000 kanale në YouTube, e përpiluar në një nga tabelat, shënonte “kanalet e rekomanduara” nga CBS New York, AMC Theaters, Pixar, Disney Plus, Disney CD dhe Monterey Bay Aquarium. (Sepse asnjë model i AI nuk është i plotë pa lundër.)
Për më tepër, Runway thuhet se përpiloi një listë të veçantë videosh nga faqet e piraterisë. Një fletëllogaritëse e titulluar “Burim jo-YouTube” përfshin 14 lidhje me burime si një arkiv i paautorizuar në internet i filmave të Studio Ghibli , faqet e piraterisë së animeve dhe filmave, një faqe fansash që shfaq videot e lojërave Xbox dhe sajtin e transmetimit të animuar kisscartoon.sh.
Në atë që mund të shihet si një konfirmim mallkim që kompania përdori të dhënat e trajnimit, 404 Media zbuloi se duke nxitur gjeneratorin e videove me emrat e YouTuber-ve të njohur të listuar në tabela, nxirrte rezultate që kishin një ngjashmëri të çuditshme. Më e rëndësishmja, futja e emrave të njëjtë në modelin më të vjetër Gen-2 të Runway – të trajnuar përpara të dhënave të supozuara në tabelat – gjeneroi rezultate “të palidhura” si burrat gjenerikë me kostume. Për më tepër, pasi publikimi kontaktoi Runway duke pyetur për ngjashmëritë e YouTubers që shfaqen në rezultate, mjeti AI ndaloi së gjeneruari ato krejtësisht.
“Shpresoj që duke ndarë këtë informacion, njerëzit do të kenë një kuptim më të mirë të shkallës së këtyre kompanive dhe çfarë po bëjnë ata për të bërë video ‘cool'”, tha ish-punonjësi për 404 Media.
Kur u kontaktua për koment, një përfaqësues i YouTube e drejtoi Engadget në një intervistë që CEO i saj Neal Mohan i dha Bloomberg në prill. Në atë intervistë, Mohan e përshkroi trajnimin në videot e tij si një “shkelje të qartë” të kushteve të saj. “Komentet tona të mëparshme për këtë ende qëndrojnë,” i shkroi zëdhënësi i YouTube Jack Mason për Engadget.
Runway nuk iu përgjigj një kërkese për commeInt deri në kohën e publikimit.
Të paktën disa kompani të inteligjencës artificiale duket se janë në një garë për të normalizuar mjetet e tyre dhe për të vendosur lidershipin në treg përpara se përdoruesit – dhe gjykatat – të kuptojnë se si është bërë sallami i tyre. Trajnimi me leje përmes marrëveshjeve të licencuara është një gjë, dhe kjo është një tjetër taktikë që kompanitë si OpenAI kanë adoptuar së fundmi . Por është një propozim shumë më skicues (nëse jo i paligjshëm) për të trajtuar të gjithë internetin – materialet me të drejta autoriale dhe të gjitha – si të gatshme në një garë të tmerrshme për fitim dhe dominim.