OpenAI akuzon DeepSeek për “përfitim pa kontribuar” nga kërkimi dhe zhvillimi amerikan

foto

OpenAI ka akuzuar DeepSeek për keqpërdorim në zhvillimin e versionit të ardhshëm të modelit të saj të inteligjencës artificiale madje edhe para çdo lançimi zyrtar.

foto

“Modeli i ardhshëm i DeepSeek (pavarësisht nga forma e tij) duhet të kuptohet në kontekstin e përpjekjeve të tij të vazhdueshme për të përfituar lirisht nga aftësitë e zhvilluara nga OpenAI dhe laboratorë të tjerë kufitarë të SHBA-së”, tha OpenAI në një memo drejtuar Komitetit të Përzgjedhur të Dhomës së Përfaqësuesve të SHBA-së për Kinën më 12 shkurt.

foto

DeepSeek nuk ka konfirmuar asnjë lançim të ri.

Shqetësimet e OpenAI mund të rrjedhin nga pritjet se kompania me seli në Hangzhou mund të bëjë një njoftim të rëndësishëm gjatë festimeve të Vitit të Ri Hënor javën e ardhshme, duke i bërë jehonë lançimit surprizë që organizoi vitin e kaluar.

“Në këtë garë armatimi me rreziqe të larta të inteligjencës artificiale, ka një luftë të vazhdueshme për njohuritë, aftësitë, saktësinë dhe efikasitetin e modeleve”, tha për Rest of World Neil Shah, nënkryetar i kërkimit në Counterpoint Research. Konflikti pasqyron tensione më të mëdha në zhvillimin global të inteligjencës artificiale, tha Shah.

DeepSeek u bë një nga konkurrentët kryesorë në garën globale të inteligjencës artificiale pothuajse brenda natës kur lançoi modelin e tij R1 gjatë periudhës së Vitit të Ri Hënor vitin e kaluar, duke pretenduar performancë të krahasueshme me modelet më të mira amerikane, pavarësisht se ishte trajnuar me shumë më pak çipa të përparuar. Lançimi rindezi debatet në Uashington nëse kontrollet e eksportit të SHBA-së mbi gjysmëpërçuesit e përparuar ishin të mjaftueshme për të ruajtur epërsinë e Amerikës në inteligjencën artificiale.

Në memon e saj, OpenAI akuzoi DeepSeek për përdorimin e teknikave të “distilimit” – një metodë e zakonshme ku një model më i vogël trajnohet në rezultatet e një modeli më të fuqishëm për të replikuar aftësitë e tij.

“Ne kemi vëzhguar llogari të lidhura me punonjësit e DeepSeek që zhvillojnë metoda për të anashkaluar kufizimet e aksesit të OpenAI dhe modelet e aksesit përmes routerëve të paqartë të palëve të treta dhe mënyrave të tjera që maskojnë burimin e tyre”, thuhej në memo. “Ne gjithashtu e dimë se punonjësit e DeepSeek zhvilluan kod për të aksesuar modelet e inteligjencës artificiale amerikane dhe për të marrë rezultate për distilim në mënyra programatike. Ne besojmë se DeepSeek gjithashtu përdor routerë të palëve të treta për të aksesuar modelet kufitare nga laboratorë të tjerë amerikanë.”

OpenAI tha se nuk lejon që rezultatet e saj të përdoren për të krijuar “modele imituese të inteligjencës artificiale në kufirin e nivelit të lartë” që replikojnë aftësitë e saj.

Kjo nuk është hera e parë që OpenAI ka ngritur shqetësime në lidhje me distilimin. Kompania hetoi nëse DeepSeek kishte distiluar të dhënat e saj menjëherë pas lançimit të modelit R1 në janar të vitit të kaluar.

Austin Horng-En Wang, një shkencëtar politik i asociuar në think-tankun RAND Corporation, vuri në pikëpyetje pse OpenAI zgjodhi të përshkallëzohej tani, veçanërisht pasi kompanitë dhe politikëbërësit kinezë kanë shtyrë hapur për një ekosistem të IA-së me burim të hapur që nga zbulimi i madh i DeepSeek vitin e kaluar.

“Një arsye e mundshme për akuzën është parandalimi i DeepSeek dhe kompanive kineze nga blerja e më shumë çipave për të distiluar modelin amerikan, në mënyrë që modelet amerikane të mund të ruajnë pozicionin e tyre kryesor”, tha Wang për Rest of World .

Modeli R1 i DeepSeek ka ndihmuar në nxitjen e përqafimit nga Kina të modeleve të inteligjencës artificiale me peshë të hapur — sisteme që zhvilluesit në mbarë botën mund t’i shkarkojnë, modifikojnë dhe vendosin. Kjo qasje është në kontrast me sistemet e mbyllura të preferuara nga shumica e gjigantëve të teknologjisë amerikane, të cilët kontrollojnë fort aksesin në modelet, të dhënat dhe arkitekturën e tyre.

Muajin e kaluar, gjigantët kinezë të teknologjisë dhe startup-et e inteligjencës artificiale kanë nxituar të publikojnë modelet e tyre më të fundit të hapura përpara DeepSeek.

“Realiteti është se asnjë nga modelet nuk është një ishull dhe e gjithë industria ka evoluar kryesisht bazuar në të mësuarit rekursiv”, tha Shah. “Pjesëmarrësit e rinj në shumë raste po kalojnë nëpër të njëjtat rrugë të ‘distilimit’ dhe ‘optimizimit’.”