Zgjerimi i silikonit të personalizuar të Meta Platforms për të fuqizuar ngarkesat tona të punës me AI

Në vitin 2023, ne zhvilluam Meta Training and Inference Accelerator (MTIA), një familje çipash silikoni të ndërtuar me porosi për të fuqizuar ngarkesat tona të punës të IA-së në mënyrë efikase. Tani, ne po zhvillojmë dhe po vendosim në përdorim katër breza të rinj çipash brenda dy viteve të ardhshme – një ritëm shumë më i shpejtë se ciklet tipike të çipave – për të mbështetur renditjen, rekomandimet dhe ngarkesat e punës të GenAI.

Ndërsa ngarkesat tona aktuale të punës në IA vazhdojnë të rriten dhe të evoluojnë, ne po ndjekim një qasje portofoli për të shkallëzuar kapacitetin tonë të infrastrukturës duke furnizuar silikon nga një gamë liderësh të industrisë , ndërkohë që e mbajmë silikonin tonë të personalizuar MTIA në qendër të strategjisë sonë të infrastrukturës së IA-së.

Ne vendosim qindra mijëra çipa MTIA për ngarkesa pune të nxjerra nga përmbajtja organike dhe reklamat në aplikacionet tona. Këta çipa janë projektuar posaçërisht për ngarkesat tona të punës dhe janë pjesë e një zgjidhjeje të personalizuar full-stack, duke na ndihmuar të krijojmë një sistem shumë të optimizuar që është i përshtatur për nevojat tona. Ky sistem arrin efikasitet më të madh llogaritës sesa çipat e përdorimit të përgjithshëm për qëllimet tona të synuara , duke e bërë MTIA shumë më efikase nga ana e kostos.

Ne po vazhdojmë të përparojmë planin e MTIA -s duke zhvilluar katër breza të rinj çipash , secili duke sjellë përmirësime të rëndësishme në llogaritje, bandwidth të memories dhe efikasitet. MTIA 300 do të përdoret për trajnimin e renditjes dhe rekomandimeve dhe është tashmë në prodhim. MTIA 400, 450 dhe 500 do të jenë të aftë të trajtojnë të gjitha ngarkesat e punës, por ne do t’i përdorim kryesisht këto çipa për të mbështetur prodhimin e inferencës GenAI në të ardhmen e afërt dhe deri në vitin 2027.

Modulariteti i silikonit tonë lejon që këto çipa të rinj të vendosen në infrastrukturën ekzistuese të sistemit të rafteve, duke përshpejtuar kohën e prodhimit.

Ne kemi zhvilluar një strategji konkurruese për MTIA-n duke i dhënë përparësi zhvillimit të shpejtë dhe përsëritës, një fokus te përfundimet e para dhe një përshtatjeje pa probleme duke u bazuar në standardet e industrisë.

Ndërkohë që industria zakonisht lançon një çip të ri të inteligjencës artificiale çdo një deri në dy vjet, ne kemi zhvilluar kapacitetin për të lançuar tonin çdo gjashtë muaj ose më pak duke u bazuar në dizajnet tona modulare dhe të ripërdorshme. Ky ritëm i përshpejtuar na mundëson të përshtatemi shpejt me teknikat në zhvillim të inteligjencës artificiale , të përvetësojmë teknologjitë më të fundit të harduerit dhe të minimizojmë kostot që lidhen me zhvillimin dhe vendosjen e gjeneratave të reja të çipave.

Çipat kryesorë zakonisht ndërtohen për ngarkesën më të kërkuar të punës – trajnim paraprak GenAI në shkallë të gjerë – dhe më pas aplikohen, shpesh me më pak kosto efektive, në ngarkesa të tjera pune si nxjerrja e përfundimeve GenAI. Ne ndjekim qasjen e kundërt: MTIA 450 dhe 500 optimizohen së pari për nxjerrjen e përfundimeve GenAI, dhe më pas mund të përdoren për të mbështetur ngarkesa të tjera pune sipas nevojës, duke përfshirë trajnimin dhe nxjerrjen e përfundimeve të renditjes dhe rekomandimeve , si dhe trajnimin GenAI. Kjo e mban MTIA-n të akorduar mirë me rritjen e parashikuar të kërkesës për nxjerrjen e përfundimeve GenAI.

MTIA është ndërtuar që nga fillimi mbi ekosisteme softuerësh dhe harduerësh standarde të industrisë, si PyTorch, vLLM, Triton dhe Open Compute Project ( OCP ), duke mundësuar miratimin pa probleme të çipave MTIA. Përtej softuerëve standarde të industrisë, zgjidhjet e sistemit dhe rafteve të MTIA përputhen me standardet OCP, duke i mundësuar MTIA-s të vendoset pa probleme në qendrat e të dhënave.

Nuk ka asnjë çip të vetëm që mund të përmbushë të gjitha kërkesat e nevojave tona të ndryshme , prandaj po punojmë për të vendosur një sërë çipesh që janë të optimizuar për secilin prej ngarkesave tona të ndryshme të punës. Ne besojmë se qasja jonë ndaj portofolit do të na mundësojë të përparojmë dhe të inovojmë me një ritëm të pakrahasueshëm , duke na afruar më shumë me qëllimin tonë për të krijuar superinteligjencë personale për të gjithë.

Tags: AI, Apps, Artificial Intelligence, GenAI, Inference Accelerator, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, Meta, Meta Platforms, MTIA, OpenAI

Zgjerimi i silikonit të personalizuar të Meta Platforms për të fuqizuar ngarkesat tona të punës me AI

Meta Platforms prezanton mjete të reja për zbulimin e mashtrimeve në Facebook, WhatsApp dhe Messenger

Amazon fiton urdhër gjykate për të bllokuar agjentin e blerjeve me AI të Perplexity

YouTube tejkalon The Walt Disney Company, Paramount Global dhe Warner Bros. Discovery në të ardhurat nga reklamat në vitin 2025

Anthropic i thotë gjykatësit se miliarda janë në lojë nëse United States heq dorë nga mjeti i AI

Meta Platforms prezanton mjete të reja për zbulimin e mashtrimeve në Facebook, WhatsApp dhe Messenger

Amazon fiton urdhër gjykate për të bllokuar agjentin e blerjeve me AI të Perplexity

Bashkë-CEO i Asus e quan MacBook Neo një tronditje