Google ka shitur aq shumë kapacitet TPU sa edhe studiuesit e vet po presin në radhë për pjesën e mbetur
Google ka kaluar një dekadë duke ndërtuar në heshtje pozicionin më të lakmueshëm në infrastrukturën e IA-së: një biznes të shëndetshëm cloud, çipat e vet të personalizuar dhe marrëveshje furnizimi që i bëjnë TPU-të e saj alternativën e parazgjedhur ndaj Nvidia-s për klientët e mëdhenj të jashtëm.

Suksesi i asaj strategjie ka prodhuar një problem të brendshëm që kompania nuk e kishte parashikuar.

Julia Love e Bloomberg raportoi të hënën se studiuesit e inteligjencës artificiale të Google, përfshirë ekipet brenda Google DeepMind, tani po përpiqen të fitojnë akses në burimet kompjuterike që punëdhënësi i tyre po ua shet gjithashtu Anthropic dhe Meta.
Shkaku strukturor është i thjeshtë. Google ka rënë dakord të investojë deri në 40 miliardë dollarë në Anthropic në një marrëveshje që përfshin pesë gigavat kapacitet TPU gjatë pesë viteve dhe qasje në deri në një milion çipa Ironwood të gjeneratës së shtatë.
Një linjë furnizimi e veçantë, e ndërmjetësuar nga Broadcom, mbulon një kapacitet shtesë prej 3.5 GW TPU për Anthropic nga viti 2027, duke u bazuar në 1 GW që kompania po merr tashmë në vitin 2026. Vetë Anthropic e ka përshkruar publikisht paketën TPU të Google si qendrore në planin e saj të trajnimit dhe shërbimit.
Meta, klienti tjetër i TPU-së në shkallë komerciale që Bloomberg përmend, nënshkroi marrëveshjen e vet më parë këtë vit. Kapaciteti që këto angazhime bllokojnë është një kapacitet që nuk është i disponueshëm për ekipet e modelit të brendshëm të Google pa radhë.
Drejtori ekzekutiv i DeepMind, Demis Hassabis, tha më parë këtë vit se kufizimi ndikon në dy drejtime. Disa nga pengesat janë pajisjet: “disa furnizues të disa komponentëve kryesorë”, siç e tha ai, me memorien me brez të lartë nga Samsung, Micron dhe SK Hynix si pika më e përmendur e pengesës.
Një pjesë e saj është rendimenti i kërkimit, sepse, sipas fjalëve të Hassabis, studiuesve ‘u duhen shumë çipa për të qenë në gjendje të eksperimentojnë mbi ide të reja në një shkallë mjaft të madhe’. Kufizimi i harduerit është pjesërisht jashtë kontrollit të Google. Kufizimi i shpërndarjes së brendshme nuk është.
Aritmetika poshtë kësaj është e madhe. Alphabet ka një diapazon të orientuar shpenzimesh kapitale prej 175-185 miliardë dollarësh për vitin 2026 , brenda një shpenzimi të kombinuar të infrastrukturës së inteligjencës artificiale të kompanive të mëdha teknologjike që ka kaluar 650 miliardë dollarë këtë vit. Google, sipas komenteve të veta, ka sjellë mbi një gigavat kapacitet të ri llogaritës të inteligjencës artificiale në internet në vitin 2026.
Basti dhjetëvjeçar mbi TPU- të më në fund po prodhon atë lloj avantazhi të ekonomisë së njësisë që i lejon kompanisë të shesë çipat e saj, të presë modelet e konkurrentëve të saj dhe të kryejë kërkimet e veta në nivel të avancuar mbi të njëjtën pëlhurë. Pëlhura thjesht nuk është më mjaftueshëm e madhe për të tre përdorimet në të njëjtën kohë.
Raportimi i Bloomberg përmend dy sinjale specifike të tensionit. Studiues, përfshirë Ioannis Antonoglou, një kontribues i DeepMind me përvojë të gjatë, janë larguar për role në startup-e gjatë 18 muajve të fundit, një trend që është përshpejtuar ndërsa qasja në kompjuterë është bërë më e vështirë për t’u siguruar brenda Google.
Oren Etzioni, ish-drejtori ekzekutiv i Institutit Allen për IA-në, i cituar në artikull, e ka paraqitur publikisht dinamikën si rezultat të parashikueshëm të një tregu të brendshëm në të cilin fuqia kompjuterike racionohet nga niveli menaxherial në vend të ekonomisë së kostos për njësi që rregullon kontratat me klientët e jashtëm.
Google ka kaluar 18 muajt e fundit në një pozicion delikat: i duhet që programi i saj TPU të demonstrojë tërheqje vëllimore me klientë të jashtëm të emëruar për të validuar teknologjinë kundrejt Nvidia, duke ruajtur njëkohësisht kapacitet të brendshëm të mjaftueshëm për trajnime Gemini dhe kërkime DeepMind.
Zinxhiri i furnizimit me çipa inference me katër partnerë me Broadcom, MediaTek dhe Marvell është një mbrojtje e projektuar për të lehtësuar kufizimin duke shtuar kapacitet pas trajnimit TPU. Ai ende nuk është dërguar në shkallën që kërkon kurba e kërkesës.
Google nuk e kundërshtoi formulimin e ndarjes së brendshme të Bloomberg në procesverbal; ai vuri në dukje qëndrimin e saj më të gjerë të investimeve në infrastrukturë dhe faktin se kufizimet llogaritëse janë një kusht për të gjithë kategorinë dhe jo specifik për Google.
Kjo është e vërtetë sipas provave: çdo ofrues i madh modelesh, në leximin më të qartë të fitimeve të tremujorit të parë 2026, është i kufizuar në llogaritje në krahasim me aspiratat e veta kërkimore.
Ajo që e bën versionin e Google të vlefshëm për lajm është krahasimi krah për krah: kompania, në të njëjtën kohë, është bërë furnizuesi më i madh i infrastrukturës për konkurrentët e saj kryesorë. Nëse mund të vazhdojë ta shesë asetin dhe ta përdorë atë, kjo është çështja që do të zgjidhet në disa tremujorë të ardhshëm.
