Silicon Valley dëshiron t’i shpëtojë ‘taksës Nvidia

foto

Ndërsa çipat Nvidia do të vazhdojnë të dominojnë trajnimin në IA, më shumë çipa të rinj për nxjerrjen e përfundimeve mund t’u kursejnë kompanive dhjetëra miliarda dollarë.

foto

Sam Altman është ankuar prej muajsh për mungesën e çipave Nvidia që po ngadalëson lançimet e ChatGPT. Partneriteti i ri prej 10 miliardë dollarësh i OpenAI me Broadcom për çipa të personalizuar tregon se kompania më në fund po bën diçka për këtë.

foto

Partneriteti, i zbuluar më parë këtë muaj pas njoftimit të Broadcom për fitimet, nënvizon një realitet në rritje: Kompanitë janë të dëshpëruara për t’i shpëtuar asaj që industria e quan “taksa e Nvidia” – marzhet bruto prej afërsisht 60% të gjigantit të çipave mbi procesorët që janë bërë thelbësorë për zhvillimin e inteligjencës artificiale.

Altman ka qenë i zëshëm në lidhje me mungesat e GPU-ve që po pengojnë lëshimet e ChatGPT, duke shkruar në X se kompania “nuk kishte më GPU” dhe duhej të shtonte “dhjetëra mijëra” të tjera për të lançuar veçori të reja. Por OpenAI nuk është e vetme në këtë zhgënjim. Në të gjithë Silicon Valley dhe më gjerë, një revolucion po zien në zhvillimin e çipave të rinj për t’u çliruar nga kontrolli i Nvidia-s. Kjo është veçanërisht e vërtetë për inferencën, që është kur sistemet e IA-së u përgjigjen pyetjeve ose krijojnë përmbajtje për përdoruesit.

Ndërsa çipat Nvidia do të vazhdojnë të dominojnë trajnimin e inteligjencës artificiale, më shumë çipa të rinj të nxjerrjes së përfundimeve mund t’u kursejnë kompanive dhjetëra miliarda dollarë dhe të ulin ndjeshëm konsumin e energjisë. Matematika është bindëse: Nxjerrja e përfundimeve ndodh sa herë që dikush i bën ChatGPT një pyetje ose gjeneron një imazh, duke e bërë atë shumë më të shpeshtë sesa procesi i trajnimit një herësh.

Çipi Broadcom nuk është projektuar për të sfiduar drejtpërdrejt Nvidia-n, sipas Wall Street Journal, por përkundrazi për të “mbushur boshllëqet” në nevojat e harduerit të OpenAI. Kjo qasje hibride pasqyron strategjinë më të gjerë të industrisë – jo domosdoshmërisht duke zëvendësuar plotësisht Nvidia-n, por duke zvogëluar varësinë përmes alternativave të specializuara.

Kompani si Positron pretendojnë se çipat e tyre mund të ofrojnë performancë dy deri në tre herë më të mirë për dollar dhe efikasitet energjie tre deri në gjashtë herë më të mirë sesa sistemet e gjeneratës së ardhshme të Nvidia-s. Groq, e themeluar nga ish-kreu i zhvillimit të çipave të inteligjencës artificiale të Google, pretendon se çipat e saj të specializuar mund ta bëjnë ChatGPT të funksionojë më shumë se 13 herë më shpejt.

Ofruesit e mëdhenj të cloud-it nuk po presin që startup-et të zgjidhin varësinë e tyre nga Nvidia. Google , Amazon dhe Microsoft po zhvillojnë çipa të fokusuar në inferencë për mjetet e tyre të brendshme të inteligjencës artificiale dhe shërbimet cloud. Këto përpjekje shumëvjeçare dhe të financuara mirë përfaqësojnë një sfidë të drejtpërdrejtë për dominimin e Nvidia-s në tregun e inferencës.

Edhe Qualcomm po kthehet te produktet e qendrave të të dhënave pasi braktisi tregun e serverëve në vitin 2018. Drejtori ekzekutiv Cristiano Amon kohët e fundit paralajmëroi plane që përqendrohen në “grupime konkluzionesh që kanë të bëjnë me performancë të lartë me fuqi shumë të ulët”.

Por disa po bashkojnë forcat në vend që të luftojnë. Intel njoftoi këtë javë se do të ndërtojë çipa të personalizuar që integrohen me sistemet e Nvidia-s, me Nvidia-n që merr një pjesë prej 5 miliardë dollarësh në Intel si pjesë e marrëveshjes.

Në Kinë, ku kufizimet e eksportit të SHBA-së kufizojnë aksesin në çipat e përparuar të inteligjencës artificiale, Alibaba dhe Baidu kanë filluar të përdorin çipa të projektuar brenda kompanisë për të trajnuar modelet e inteligjencës artificiale, duke zëvendësuar pjesërisht procesorët Nvidia. Çipi i inteligjencës artificiale i Alibaba-s thuhet se tani është konkurrues me H20 të Nvidia-s, procesorin më të fuqishëm që kompania mund të shesë në Kinë.

Ambiciet e Indisë për gjysmëpërçues i shtojnë një dimension tjetër konkurrencës globale, me 10 projekte, 18 miliardë dollarë angazhime investimi dhe më shumë se 7 miliardë dollarë subvencione të ndara. Diaspora indiane mund të jetë vendimtare, me drejtuesit që vënë në dukje se një e treta e inxhinierëve dhe udhëheqjes së lartë të Nvidia-s janë indianë, duke lehtësuar potencialisht shqetësimet e klientëve globalë në lidhje me bashkëpunimin me prodhuesit e rinj indianë të çipave.

Kur ​​të mos ketë më çipa, mbështetuni te India, tha kryeministri indian Narendra Modi në një konferencë gjysmëpërçuesish këtë muaj.

Nvidia nuk qëndron në vend. Kompania pretendon se sistemet e saj më të fundit Blackwell ofrojnë efikasitet 25 herë më të mirë të nxjerrjes së përfundimeve për vat krahasuar me gjeneratat e mëparshme. Por shpejtësia nuk është gjithçka. Çipat e Nvidia mund të përballojnë çdo model të ri të IA-së që do të dalë më pas, ndërsa çipat e specializuar të nxjerrjes së përfundimeve janë ndërtuar për modelet e sotme. Në një industri që lëviz me shpejtësi ku arkitekturat e IA-së ndryshojnë vazhdimisht, këto çipa të specializuar mund të bëhen të vjetëruara brenda natës.

Gjithashtu, nuk janë vetëm çipat. Cuda, softueri që përdor procesorët e Nvidia-s, është ai që shumica e zhvilluesve të inteligjencës artificiale dinë ta përdorin. Të mësosh një sistem të ri do të thotë të trajnosh ekipet me mjete të panjohura, duke krijuar një pengesë tjetër për ndërruesit e mundshëm.

Edhe rekordi aktual për konkurrentët është i mangët. Google ka zhvilluar TPU për gati një dekadë, ndërsa Microsoft dhe Amazon kanë investuar miliarda në çipat e tyre gjatë disa viteve pa pasur shumë për të treguar ende. Hulumtimet tregojnë se afërsisht 90% e punimeve mbi inteligjencën artificiale ende përmendin harduerin Nvidia, një dominim që mezi është ndryshuar pavarësisht viteve të konkurrencës së financuar mirë.

Megjithatë, ndërsa analistët parashikojnë që Nvidia do të jetë furnizuesi për 100% të tregut të trajnimit, ajo do të kapë vetëm 50% të tregut të inferencës në planin afatgjatë. Kjo ende lë pothuajse 200 miliardë dollarë shpenzime vjetore për çipa deri në vitin 2028, të mjaftueshme për të motivuar kompanitë që të vazhdojnë të përpiqen të kapin një pjesë të tortës së çipave.

Beteja e informatikës së përfundimeve përfaqëson më shumë sesa thjesht konkurrencë teknike. Bëhet fjalë për riformësimin e strukturës ekonomike të IA-së, zvogëlimin e varësisë nga një furnizues i vetëm dhe bërjen e aftësive të përparuara të IA-së të arritshme për një gamë më të gjerë kompanish dhe vendesh. Siç tregon partneriteti i Sam Altman me Broadcom, edhe kompanitë më të suksesshme të IA-së po vënë bast se zgjidhjet e personalizuara do të rezultojnë superiore ndaj dominimit të gatshëm.