Huang i Nvidia paralajmëron se DeepSeek që funksionon në çipat Huawei do të ishte ‘i tmerrshëm’ për SHBA-në
Drejtori ekzekutiv i Nvidia-s, Jensen Huang, tha në podkastin Dwarkesh të mërkurën se nëse DeepSeek do të optimizonte modelet e saj të reja të inteligjencës artificiale për të funksionuar në çipat Huawei në vend të pajisjeve amerikane, ky do të ishte “një rezultat i tmerrshëm” për Shtetet e Bashkuara. Paralajmërimi e paraqet partneritetin në zhvillim midis laboratorit më të aftë të inteligjencës artificiale të Kinës dhe prodhuesit të saj më të përparuar të çipave si një kërcënim të drejtpërdrejtë ndaj ndikimit teknologjik që ka mbështetur dominimin amerikan të inteligjencës artificiale gjatë dekadës së fundit.

“ Nëse modelet e ardhshme të IA-së optimizohen në një mënyrë shumë të ndryshme nga ajo amerikane e teknologjisë ”, tha Huang, dhe ndërsa “ IA përhapet në pjesën tjetër të botës” me standardet dhe teknologjinë kineze, Kina “ do të bëhet superiore ndaj ” SHBA-së. Deklarata është e rëndësishme sepse vjen nga CEO i kompanisë që ka përfituar më shumë nga marrëveshja aktuale, në të cilën praktikisht çdo model i IA-së në botë trajnohet në GPU-të Nvidia duke përdorur kuadrin softuerik CUDA të Nvidia-s.

DeepSeek po përgatitet të lançojë V4, një model multimodal bazë që pritet të dalë më vonë këtë muaj. The Information raportoi më herët në prill se V4 do të funksiononte në procesorin më të fundit Ascend 950PR të Huawei, ndërsa një raport i veçantë i Reuters sugjeroi që modeli ishte trajnuar në çipat Blackwell të Nvidia, gjë që do të përbënte një shkelje të kontrolleve të eksportit të SHBA-së. Të dy pretendimet nuk janë domosdoshmërisht kontradiktore: një model mund të trajnohet në një grup harduerësh dhe të vendoset për nxjerrje përfundimesh në një tjetër.
Ajo që e bën integrimin e Huawei-t domethënës është migrimi i softuerit që qëndron pas tij. DeepSeek ka kaluar muaj duke rishkruar kodin e tij kryesor për të funksionuar me strukturën CANN të Huawei-t, duke u larguar nga ekosistemi CUDA që Nvidia ka kaluar dy dekada duke e ndërtuar në themel të zhvillimit të IA-së. Dominimi i CUDA-s ka funksionuar si një shtresë e dytë e kontrollit amerikan mbi IA-në, përtej vetë çipave. Kufizimet e eksportit mund të kufizojnë se cili harduer i Nvidia-s arrin në Kinë, por për sa kohë që laboratorët kinezë shkruan softuerin e tyre për CUDA-n, ata mbetën të varur nga ekosistemi i Nvidia-s edhe kur përdornin procesorë alternativë. Kalimi i DeepSeek në CANN e thyen këtë varësi.
Modeli V3 i DeepSeek, i lançuar në fund të vitit 2024, u trajnua në 2,048 GPU Nvidia H800, një çip i krijuar posaçërisht për tregun kinez, i cili vetë u ndalua të shitej në Kinë në vitin 2023. Kompania ka demonstruar tashmë se mund të prodhojë modele konkurruese në kufijtë e nivelit të lartë me më pak burime sesa rivalët e saj amerikanë. Modeli i saj i arsyetimit R1 përputhej ose tejkalonte performancën e modeleve që kushtonin shumë më tepër për t’u trajnuar. V4 do ta zgjeronte këtë qasje duke provuar se kompania mund ta bëjë këtë pa asnjë pajisje harduerike amerikane.
Sa i përket performancës së papërpunuar, çipat e Huawei nuk janë konkurrues me më të mirët e Nvidia-s. Ascend 910C, paraardhësi i 950PR, ofron afërsisht 60% të performancës së inferencës së H100 të Nvidia-s, një çip që është vetë dy breza pas më të mirës aktuale të Nvidia-s. Çipat amerikanë janë afërsisht pesë herë më të fuqishëm se ekuivalentët e tyre kinezë sot, dhe ky hendek parashikohet të zgjerohet në 17 herë deri në vitin 2027. Huawei synon 750,000 dërgesa çipash IA në vitin 2026, por prodhimi i tij total përfaqëson vetëm 3 deri në 5% të fuqisë totale llogaritëse të Nvidia-s.
Por shqetësimi i Huang nuk ka të bëjë me hendekun aktual të performancës. Ai tha në podcast se edhe nëse Kina do të kishte çipa inferiorë, ajo prapë mund të arrinte SHBA-në në zhvillimin e IA-së duke pasur parasysh ” energjinë e saj të bollshme ” dhe “grupin e madh të studiuesve të IA-së”. Implikimi është se performanca e pajisjeve të papërpunuara është vetëm një ndryshore dhe se optimizimi i softuerit, talenti i studiuesve dhe disponueshmëria e energjisë mund të kompensojnë disavantazhet e silikonit. Nëse V4 performon mirë në çipat Ascend, kjo vërteton një rrugë alternative për zhvillimin e IA-së që nuk varet nga Nvidia në asnjë pikë të zinxhirit të furnizimit.
Situata ekspozon një tension në qendër të politikës amerikane të eksportit të çipave. Nvidia rifilloi prodhimin e H200, një çip më i fuqishëm, për shitje në Kinë, siç konfirmoi Huang në mars. Por Kina ka bllokuar importet e H200 për të mbrojtur biznesin vendas të çipave të Huawei, dhe drejtori financiar i Nvidia ka thënë se kompania nuk ka regjistruar të ardhura nga shitjet e H200 në Kinë. Kontrollet e hartuara për të kufizuar aftësitë e inteligjencës artificiale të Kinës po përshpejtojnë në vend të kësaj zhvillimin e një alternative kineze.
Përvoja e DeepSeek me modelin e saj R2 ilustron si premtimin ashtu edhe kufizimet e rrugës së Huawei. R2 u vonua vazhdimisht për shkak të dështimeve të trajnimit në harduerin Huawei. Autoritetet kineze e kishin nxitur DeepSeek të trajnohej në çipat vendas, por kompania hasi probleme stabiliteti që e detyruan atë të kthehej te GPU-të Nvidia për trajnim, ndërsa përdori çipat Huawei vetëm për nxjerrje përfundimesh. Dallimi ka rëndësi: trajnimi është faza më intensive e llogaritjes së zhvillimit të IA-së, dhe fakti që çipat Huawei nuk mund ta përballonin atë në mënyrë të besueshme sugjeron se hendeku i harduerit është real. Por nxjerrja përfundimtare, faza ku modelet u shërbejnë përdoruesve, është vendi ku gjenerohet vlera komerciale, dhe çipat e Huawei duken të përshtatshëm për këtë qëllim.
Ndërkohë, ligjvënësit amerikanë po bëjnë presion për të shtrënguar më tej kufizimet. Të enjten, ligjvënësit dhe ekspertët akuzuan Kinën se po blen ” çfarë mundet ” dhe po vjedh ” çfarë nuk mundet ” në industrinë e inteligjencës artificiale, dhe i bënë thirrje qeverisë të vlerësojë vendosjen e DeepSeek, Moonshot AI dhe MiniMax në listën e subjekteve për kontrollin e eksportit.
Paralajmërimi i Huang në fund të fundit ka të bëjë me bashkë-dizajnimin softuer-hardware. Dominimi i Nvidia-s nuk mbështetet vetëm në prodhimin e çipave më të shpejtë, por edhe në pozicionin e CUDA-s si mjedisi i parazgjedhur i zhvillimit për IA-në. Kur studiuesit shkruajnë kod, ata e shkruajnë atë për CUDA-n. Kur startup-et ndërtojnë produkte, ato i ndërtojnë ato në CUDA. Kur qeveritë investojnë në infrastrukturën e IA-së, ato blejnë GPU-të Nvidia sepse kjo është ajo që kërkon softueri. Migrimi i DeepSeek në CANN kërcënon të krijojë një ekosistem paralel në të cilin asnjë nga këto nuk zbatohet.
Shkalla e biznesit të Nvidia-s i bën aksionet konkrete. Kapitalizimi i tregut të kompanisë tejkalon 3 trilion dollarë. Të ardhurat nga qendra e të dhënave të saj u rritën me 93% vit pas viti në tremujorin e saj më të fundit. Çipat e saj fuqizojnë pistat e trajnimit për pothuajse çdo model të madh të IA-së jashtë Kinës. Nëse laboratori më i aftë kinez i IA-së tregon se modelet konkurruese mund të ndërtohen pa Nvidia-n, argumenti për ruajtjen e kontrolleve të eksportit dobësohet, argumenti për blerjen e Nvidia-s dobësohet dhe supozimet gjeopolitike që kanë formësuar politikën e IA-së për tre vitet e fundit vihen nën presion.
Asnjë nga këto nuk do të thotë që Huawei është gati ta kalojë Nvidia-n. Hendeku në performancë është i madh dhe po rritet. Dështimet në trajnimin R2 tregojnë se pajisjet kineze nuk janë ende gati për ngarkesat më të kërkuara të punës së inteligjencës artificiale. Por Huang nuk po paralajmëron për sot. Ai po paralajmëron për një trajektore në të cilën DeepSeek e vërteton konceptin, laboratorë të tjerë e ndjekin dhe hendeku CUDA që e ka bërë Nvidia-n kompaninë më të vlefshme në zinxhirin e furnizimit me inteligjencë artificiale fillon të shkatërrohet.
Fakti që CEO i Nvidia është ai që e bën këtë argument publikisht sugjeron që ai beson se rreziku nuk është më teorik. V4 i DeepSeek do të jetë testi i parë i madh. Nëse një model themelor multimodal funksionon në mënyrë konkurruese me silikonin Huawei, paralajmërimi që Huang lëshoi të mërkurën do të duket më pak si lobim i korporatave dhe më shumë si parashikimi më i rëndësishëm në luftën e çipave të inteligjencës artificiale deri më tani.
