Meta krijon katër ‘dhoma lufte’ për të zbuluar se si DeepSeek po i kalon rivalët me kosto më të ulëta

foto

DeepSeek AI ka prishur peizazhin e AI në SHBA. Vetëm pak javë pas lançimit të modelit të tij AI, DeepSeek kaloi ChatGPT për t’u bërë aplikacioni numër një falas në App Store. Jo vetëm kjo, rritja e popullaritetit të DeepSeek shkaktoi valë tronditëse në industrinë e teknologjisë, duke çuar në një humbje prej 400 miliardë dollarësh në kapitalin e tregut për NVIDIA në SHBA. Kohët e fundit, DeepSeek lançoi Janus-Pro 7B të tij, një model novator i gjenerimit të imazheve që filloi të bëhej tituj, pasi ia kaloi modeleve si DALL-E të OpenAI, Stable Diffusion të Stability AI dhe modeleve të tjera të gjenerimit të imazheve në disa standarde.

foto

Popullariteti i DeepSeek ka tërhequr vëmendjen e Metës dhe për të kuptuar suksesin e këtij startupi kinez të AI, Meta e Mark Zuckerberg thuhet se ka mbledhur katër ekipe të specializuara, të referuara si “dhoma lufte”, të përbërë nga inxhinierë për të kuptuar se si një startup kinez i AI i mbështetur nga High-Flyer Capital Management ka arritur të arrijë performancë të barabartë me ose tejkaluar atë të konkurrentëve kryesorë si ChatGPT me një fraksion të kostos.

foto

Veçanërisht, DeepSeek fitoi popullaritet pasi lançoi modelin R1, një chatbot me AI që mundi ChatGPT. Kompania pretendon se ka investuar më pak se 6 milionë dollarë për të trajnuar modelin e saj, në krahasim me mbi 100 milionë dollarë të investuara nga OpenAI për të trajnuar ChatGPT. Dhomat e luftës së Metës do të bëjnë stuhi idesh për të gjetur mënyra se si të adresojnë kërcënimin e mundshëm që vjen nga zbulimi i DeepSeek.

Dy nga katër dhomat e luftës do t’i dedikohen të kuptuarit se si DeepSeek arriti të ulte kostot në zhvillimin dhe funksionimin e modeleve R1, me shpresën për të aplikuar të njëjtën strategji për modelin e vetë Metës AI, Llama. Një ekip tjetër do të hetojë të dhënat e trajnimit që përdori DeepSeek. Ekipi i fundit do të fokusohet në eksplorimin e mënyrave për të ridizajnuar arkitekturën e Llama për të konkurruar me teknologjinë kineze të AI.

Edhe pse Meta nuk e komentoi këtë zhvillim, një zëdhënës i Metës në një deklaratë për The Information tha se:

Ne vlerësojmë rregullisht të gjitha modelet konkurruese në procesin tonë të zhvillimit dhe e kemi bërë këtë që kur u formua [grupi] Gen Al [i kompanisë]. Llama ka qenë themelor në krijimin e ekosistemit për modelet e inteligjencës artificiale me burim të hapur dhe ne nuk mund të jemi më të entuziazmuar për ta zgjeruar këtë udhëheqje me publikimin e ardhshëm të Llama 4.

Meta është në gatishmëri të lartë sepse drejtori i infrastrukturës së Meta AI, Mathew Oldham, u ka thënë kolegëve se modeli më i ri i DeepSeek mund të tejkalojë edhe modelin e ardhshëm Llama AI, që pritet të lançohet në fillim të 2025. Edhe CEO i OpenAI, Sam Altman, i është përgjigjur rritjes së DeepSeek dhe e ka quajtur mbresëlënëse. NVIDIA, e cila është një nga vuajtësit më të mëdhenj të popullaritetit të papritur të DeepSeek, lavdëroi gjithashtu AI kineze dhe gjithashtu theksoi se si GPU-të NVIDIA u përdorën për softuerin e DeepSeek.