Huawei mohon pretendimet se kopjoi modelin e inteligjencës artificiale Qwen të Alibaba-s për “Pangu Pro”

foto

Laboratori i inteligjencës artificiale i Huawei po kundërshton akuzat për plagjiaturë nga një grup kërkimor i quajtur HonestAGI. Grupi pretendoi të premten se modeli i ri i inteligjencës artificiale Pangu Pro i Huawei është një kopje e modelit Qwen 2.5 të Alibaba. Në një deklaratë të shtunën, më 7 korrik, Laboratori Noah Ark i Huawei mohoi akuzën, duke deklaruar se modeli i tij është zhvilluar në mënyrë të pavarur.

foto

Debati publik nxjerr në pah konkurrencën e fortë dhe betejat e pronësisë intelektuale brenda industrisë së lulëzuar të inteligjencës artificiale të Kinës. Ndërsa gjigantët vendas të teknologjisë garojnë për dominim mes sanksioneve të SHBA-së, integriteti i modeleve të tyre themelore po vihet nën shqyrtim të rreptë nga komuniteti global i burimeve të hapura.

Polemika shpërtheu më 6 korrik kur një grup që e quan veten HonestAGI publikoi një raport në GitHub, i cili tani është hequr (i disponueshëm nëpërmjet Web Archive). Dokumenti pretendon se modeli Pangu Pro MoE i Huawei, i cili është publikuar së fundmi me burim të hapur, nuk është një krijim origjinal, por një version i “ricikluar” i modelit Qwen 2.5 14B të rivalit Alibaba.

Pretendimi qendror i HonestAGI mbështetet në një teknikë të re të “gjurmëve të gishtërinjve” . Metoda analizon modelet e devijimit standard të matricave të parametrave të vëmendjes (Q, K, V, O) në të gjitha shtresat e një modeli. Studiuesit argumentojnë se këto modele janë një veti e brendshme e arkitekturës dhe historisë së trajnimit të një modeli.

Kjo analizë zbuloi atë që punimi e quan një “korrelacion i jashtëzakonshëm” prej 0.927 midis Pangu dhe Qwen. HonestAGI pohon se kjo gjurmë gishtash statistikore është mjaft e fortë për t’i mbijetuar trajnimit të vazhdueshëm, një teknikë e zakonshme që mund të fshijë filigranët tradicionalë nga një model i vjedhur.

foto

Për të mbështetur argumentin e tij, grupi vuri në dukje ngjashmëri të tjera arkitekturore. Ata nxorën në pah modele pothuajse identike në projeksionet e paragjykimeve QKV dhe peshat e vëmendjes LayerNorm. Studiuesit madje zbuluan një skedar licence Qwen brenda depozitës zyrtare të kodit të Pangu në GitCode. HonestAGI e përfundoi punimin e tij duke deklaruar, “të gjitha këto pika janë rastësi? Ndoshta jo”.

Sipas studiuesve, këto modele unike dalin natyrshëm nga arkitektura themelore e një modeli dhe mund të llogariten me një funksion bazë, torch.std() , të aplikuar në matricat e parametrave. Duke normalizuar këto vlera të devijimit standard në të gjitha shtresat, ato krijojnë një nënshkrim dallues të aftë për të identifikuar prejardhjen e një modeli edhe pas modifikimeve të rëndësishme si trajnimi i vazhdueshëm.

Për të mbështetur pretendimin e tyre kryesor, studiuesit vunë në dukje një sërë provash vërtetuese. Ata theksuan se modelet e paragjykimit QKV në Pangu ishin një përputhje pothuajse e përsosur për Qwen 2.5. Ata e quajtën këtë veçanërisht “dënuese” , argumentojnë ata, sepse paragjykimi QKV ishte një tipar dallues i modeleve të hershme Qwen që që atëherë është braktisur nga shumica e projekteve me burim të hapur, përfshirë Qwen3 më të ri të Alibaba-s. Grupi vuri në dukje se hetimi i tyre është duke vazhduar, me analizën fillestare të aktivizimeve të modelit që tregon gjithashtu mbivendosje të konsiderueshme.

Grupi e sfidoi drejtpërdrejt nocionin e rastësisë, duke argumentuar se numri i madh i tipareve që mbivendosen tregon një kopjim të qëllimshëm. Ata gjithashtu pretenduan se kishin marrë deklarata nga shumë denoncues që mbështesnin hipotezën e tyre:

“Ne morëm mesazhe nga disa sinjalizues (që pretendohet se janë) në ekipin e tyre. Ata konfirmuan akuzën ndaj Pangu Pro MoE dhe gjithashtu konfirmuan se ekziston një version i Pangu Ultra MoE që është “shumë i ngjashëm” me DeepSeek-V3 (ende në proces riciklimi, por në mënyra të tjera, gjë që përputhet me informacionin e dhënë nga çështjet 2 dhe 4). Megjithatë, këto mesazhe nuk janë të verifikueshme sepse Pangu Ultra MoE nuk është publikuar dhe ne nuk jemi në gjendje të konfirmojmë identitetin e këtyre sinjalizuesve.”

Huawei lëshoi ​​një kundërshtim të shpejtë dhe të vendosur. Më 7 korrik, Laboratori i saj Noah Ark lëshoi ​​një deklaratë duke pohuar se modeli Pangu “…nuk ishte i bazuar në trajnimin gradual të modeleve të prodhuesve të tjerë…” dhe ishte zhvilluar në mënyrë të pavarur nga e para. Laboratori theksoi se modeli ishte ndërtuar tërësisht mbi çipat e patentuar të Huawei-t, Ascend AI.

Ndërsa pranoi përdorimin e një kodi me burim të hapur të palëve të treta, deklarata e Huawei theksoi se ekipi i saj i zhvillimit iu përmbajt në mënyrë strikte të gjitha kërkesave të licencimit. Mohimi e paraqet modelin Pangu si një pjesë kyçe të strategjisë së saj të vetëmjaftueshmërisë, jo si një vepër derivate.

Kjo përplasje për pronësinë intelektuale zhvillohet vetëm disa ditë pasi Huawei bëri një ndryshim të madh strategjik. Më 2 korrik, kompania i lançoi modelet e saj Pangu me burim të hapur, një veprim i interpretuar gjerësisht si një përpjekje për të ndërtuar një ekosistem softuerësh të izoluar rreth pajisjeve të saj .

Kjo strategji synon të rrisë shitjet e përshpejtuesve të saj të inteligjencës artificiale Ascend, duke krijuar një grumbull teknologjish të vetëmjaftueshëm për t’iu kundërvënë sanksioneve ndëshkuese të SHBA-së. Siç vuri në dukje Mark Einstein i Counterpoint, “objektivi i saj është që në fund të fundit të përdorë produkte me burim të hapur për të nxitur shitjet e pajisjeve, i cili është një model krejtësisht i ndryshëm nga të tjerët”. Kjo qasje që vë në plan të parë pajisjet është thelbësore për mbijetesën dhe konkurrueshmërinë e Huawei.

Incidenti nënvizon konkurrencën e ashpër në sektorin e inteligjencës artificiale në Kinë, e cila shpesh quhet “lufta e njëqind modeleve”. Gjigantët e teknologjisë si Alibaba, Baidu dhe tani Huawei po e bëjnë agresivisht inteligjencën e tyre thelbësore të hapur me burim të hapur për të kapur mendimin e zhvilluesve dhe për të dominuar tregun.

Ky shtytje drejt burimit të hapur është kritik, pasi kontrollet e eksportit të SHBA-së në mënyrë efektive i kanë shkëputur firmat kineze nga GPU-të e nivelit të lartë Nvidia. Vakumi harduerik që ka rezultuar i ka bërë çipat Ascend të Huawei një alternativë jetësore për zhvilluesit vendas.

Paul Triolo i Albright Stonebridge Group parashikoi se kufizimet e SHBA-së “… do të nënkuptojnë që GPU-ja Ascend 910C e Huawei-t ​​tani do të bëhet hardueri i preferuar për zhvilluesit e modeleve të inteligjencës artificiale (kineze) dhe për vendosjen e kapacitetit të nxjerrjes së përfundimeve”.

Akuza për plagjiaturë, pavarësisht nëse është e provuar apo jo, i ndërlikon ambiciet e Huawei-t. Ajo ngre pyetje në lidhje me transparencën dhe besimin në një moment kur kompania po përpiqet të pozicionohet si një kampione kombëtare në IA. Siç e tha HonestAGI, në një epokë ku “trajnimi i vazhdueshëm NUK është e tëra çfarë ju nevojitet për të vjedhur një model” , metodat e fuqishme për verifikimin e prejardhjes së modelit po bëhen thelbësore për konkurrencën e ndershme.