AI me burim të hapur duhet të zbulojë të dhënat e tij të trajnimit

foto

Iniciativa me burim të hapur ka lëshuar përkufizimin e saj zyrtar të inteligjencës artificiale të hapur duke vendosur terrenin për një përplasje me gjigantët e teknologjisë si Meta modelet e të cilëve nuk përputhen me rregullat.

foto

OSI ka vendosur prej kohësh standardin e industrisë për atë që përbën softuer me burim të hapur, por sistemet e AI përfshijnë elementë që nuk mbulohen nga licencat konvencionale, si të dhënat e trajnimit të modeleve. Tani, që një sistem AI të konsiderohet me të vërtetë burim i hapur, ai duhet të sigurojë:

foto

Qasje në detaje rreth të dhënave të përdorura për të trajnuar AI në mënyrë që të tjerët ta kuptojnë dhe ta rikrijojnë atë
Kodi i plotë i përdorur për të ndërtuar dhe ekzekutuar AI
Cilësimet dhe peshat nga trajnimi, të cilat ndihmojnë AI të prodhojë rezultatet e saj
Ky përkufizim sfidon drejtpërdrejt Llama e Metës, e promovuar gjerësisht si modeli më i madh i AI me burim të hapur. Llama është i disponueshëm publikisht për shkarkim dhe përdorim, por ka kufizime në përdorimin komercial (për aplikacionet me mbi 700 milionë përdorues ) dhe nuk ofron akses në të dhënat e trajnimit, duke bërë që ai të mos përmbushë standardet e OSI për liri të pakufizuar për përdorim, modifikim, dhe ndaje.

Zëdhënësi i Meta, Faith Eischen tha për Shkence.info se ndërsa “ne jemi dakord me partnerin tonë OSI për shumë gjëra”, kompania nuk pajtohet me këtë përkufizim. “Nuk ka asnjë përkufizim të vetëm të inteligjencës artificiale me burim të hapur dhe përcaktimi i tij është një sfidë sepse përkufizimet e mëparshme me burim të hapur nuk përfshijnë kompleksitetin e modeleve të sotme të AI që avancohen me shpejtësi.”

“Ne do të vazhdojmë të punojmë me OSI dhe grupe të tjera të industrisë për ta bërë AI më të aksesueshme dhe të lirë me përgjegjësi, pavarësisht nga përkufizimet teknike,” shtoi Eischen.

Për 25 vjet, përkufizimi i OSI për softuerin me burim të hapur është pranuar gjerësisht nga zhvilluesit që duan të ndërtojnë punën e njëri-tjetrit pa frikë nga paditë ose kurthe licencimi. Tani, ndërsa AI riformëson peizazhin, gjigantët e teknologjisë përballen me një zgjedhje kryesore: të përqafojnë këto parime të vendosura ose t’i refuzojnë ato. Fondacioni Linux ka bërë gjithashtu një përpjekje të fundit për të përcaktuar “AI me burim të hapur”, duke sinjalizuar një debat në rritje mbi mënyrën se si vlerat tradicionale të burimit të hapur do të përshtaten me epokën e AI.

“Tani që kemi një përkufizim të fortë në vend, ndoshta ne mund të kundërshtojmë në mënyrë më agresive kundër kompanive që janë ‘larëse të hapura’ dhe e deklarojnë punën e tyre me burim të hapur kur në të vërtetë nuk është,” Simon Willison, një studiues i pavarur dhe krijues i të hapurit. -burim multi-tool Datasette, tha për Shkence.info.

CEO i Hugging Face, Clément Delangue e quajti përkufizimin e OSI “një ndihmë e madhe në formësimin e bisedës rreth hapjes në AI, veçanërisht kur bëhet fjalë për rolin vendimtar të të dhënave të trajnimit”.

Drejtori ekzekutiv i OSI-së, Stefano Maffulli thotë se u desh dy vjet iniciativë, duke u konsultuar me ekspertë globalisht, për të përmirësuar këtë përkufizim përmes një procesi bashkëpunues. Kjo përfshinte punën me ekspertë nga akademia për mësimin e makinerive dhe përpunimin e gjuhës natyrore, filozofë, krijues të përmbajtjes nga bota Creative Commons dhe më shumë.

Ndërsa Meta përmend shqetësimet e sigurisë për kufizimin e aksesit në të dhënat e tij të trajnimit, kritikët shohin një motiv më të thjeshtë: minimizimin e përgjegjësisë ligjore dhe ruajtjen e avantazhit të tij konkurrues. Shumë modele të AI janë pothuajse me siguri të trajnuar për materiale të mbrojtura nga të drejtat e autorit; në prill, The New York Times raportoi se Meta pranoi nga brenda se kishte përmbajtje me të drejtë autori në të dhënat e tij të trajnimit “sepse ne nuk kemi asnjë mënyrë për të mos e mbledhur atë”. Ka një mori padish kundër Meta, OpenAI, Perplexity, Anthropic dhe të tjerë për shkelje të supozuara. Por me përjashtime të rralla – si Stable Diffusion, i cili zbulon të dhënat e tij të trajnimit – paditësit duhet të mbështeten aktualisht në prova rrethanore për të demonstruar se puna e tyre është gërvishtur.

Ndërkohë, Maffulli e sheh historinë me burim të hapur duke u përsëritur. “Meta po bën të njëjtat argumente” siç bëri Microsoft në vitet 1990 kur e pa burimin e hapur si një kërcënim për modelin e tij të biznesit, tha Maffulli për Shkence.info. Ai kujton se Meta i tregonte për investimin intensiv të tij në Llama, duke e pyetur “kush mendoni se do të mund të bëjë të njëjtën gjë?” Maffulli pa një model të njohur: një gjigant teknologjik që përdor koston dhe kompleksitetin për të justifikuar mbajtjen e teknologjisë së tij të mbyllur. “Ne kthehemi në ditët e para,” tha ai.

“Kjo është salca e tyre sekrete,” tha Maffulli për të dhënat e stërvitjes. “Është IP e vlefshme.”