Meta AI në modalitetin e panikut ndërsa DeepSeek pa burim të hapur fiton tërheqje dhe performon më mirë për shumë më pak

foto

Në fund të vitit të kaluar, ne raportuam për një startup kinez të AI që befasoi industrinë me lançimin e DeepSeek, një model i AI me burim të hapur që mburret me 685 miliardë parametra. Ajo që bëri tituj nuk ishte vetëm shkalla e saj, por performanca e saj – ajo tejkaloi modelet më të fundit të OpenAI dhe Meta ndërsa po zhvillohej me një fraksion të kostos.

DeepSeek së pari tërhoqi vëmendjen tonë pasi një raport i CNBC zbuloi se modeli i tij DeepSeek V3 kishte tejkaluar Llama 3.1 të Meta, GPT-4o të OpenAI dhe Qwen 2.5 të Alibaba në standardet e palëve të treta. Startup shpenzoi vetëm 5.5 milionë dollarë për trajnimin e DeepSeek V3 – një shifër që bie në kontrast me miliardat e investuara zakonisht nga konkurrentët e saj.

Vetëm një muaj pas publikimit të DeepSeek V3, kompania e ngriti shiritin më tej me lançimin e DeepSeek-R1 , një model arsyetimi i pozicionuar si një alternativë e besueshme ndaj modelit o1 të OpenAI. I licencuar sipas MIT, DeepSeek-R1 lejon zhvilluesit të distilojnë dhe komercializojnë lirisht aftësitë e tij. Kjo aksesueshmëri e ka bërë atë një zgjedhje tërheqëse për ekipet dhe zhvilluesit më të vegjël që punojnë me buxhete të ngushta, të cilët ende kanë nevojë për zgjidhje të inteligjencës artificiale me performancë të lartë.

Suksesi i papritur i DeepSeek po riformëson bisedat rreth inovacionit të AI, me disa media që shkojnë aq larg sa sugjerojnë se DeepSeek paraqet ” kërcënime për dominimin amerikan të AI ” dhe kompanitë amerikane në këtë fushë. Meta, në veçanti, duket se po ndjen presionin.

foto

Një punonjës anonim i Meta ndau zhgënjimet e tij në një postim në forumin profesional Blind , me titull, ” Meta GenAI Org në modalitetin e panikut “. Postimi nuk u ndal:

“Filloi me DeepSeek V3, i cili e bëri Llama 4 tashmë prapa në standarde. Fyerja ndaj lëndimit ishte ‘kompania e panjohur kineze me një buxhet stërvitor prej 5,5 milionë dollarësh’. Inxhinierët po lëvizin furishëm për të shpërndarë DeepSeek dhe për të kopjuar gjithçka dhe gjithçka që mundemi prej tij. As nuk po e ekzagjeroj.”

Punonjësi theksoi gjithashtu çështjet e brendshme brenda divizionit të AI të Metës:

“Menaxhmenti është i shqetësuar për justifikimin e kostos masive të GenAI org. Si do të përballeshin ata me lidershipin kur çdo ‘udhëheqës’ i GenAI org po bën më shumë se sa kushton për të trajnuar plotësisht DeepSeek V3, dhe ne kemi dhjetëra ‘udhëheqës’ të tillë… DeepSeek R1 i bëri gjërat edhe më të frikshme. Nuk mund të zbuloj informacione konfidenciale, por do të jetë publike së shpejti.”

Postimi përshkruante një organizatë të fryrë ku një mentalitet i “rrëmbimit të ndikimit” dhe punësimi i tepërt kanë zëvendësuar një qasje më të fokusuar, të drejtuar nga inxhinieria.

foto

DeepSeek është një thirrje zgjimi për industrinë e AI. Suksesi i një modeli me burim të hapur i ndërtuar mbi një buxhet të kufizuar ngre pyetje nëse gjigantët e teknologjisë po i ndërlikojnë më shumë strategjitë e tyre. Duke ulur kostot dhe duke ofruar një licencë lejuese, DeepSeek ka hapur dyert për zhvilluesit të cilët më parë nuk mund të përballonin të punonin me mjete AI me performancë të lartë.

Për Meta, OpenAI dhe lojtarë të tjerë të mëdhenj, rritja e DeepSeek përfaqëson më shumë sesa thjesht konkurrencë – është një sfidë ndaj idesë që buxhetet më të mëdha automatikisht çojnë në rezultate më të mira. Nëse këto kompani mund të përshtaten mbetet një pyetje e hapur, por një gjë është e qartë: DeepSeek ka ndryshuar skenarin dhe industria po i kushton vëmendje.

Më poshtë është një video e CNBC në YouTube që eksploron sesi modeli i ri kinez i AI, DeepSeek, po sfidon dominimin e SHBA në peizazhin e AI.