WSE-3 i Cerebra mundëson që modelet e AI të jenë dhjetë herë më të mëdha se GPT-4 dhe Gemini
Cerebras Systems ka zbuluar çipin e tretë të inteligjencës artificiale në shkallë vaferi, WSE-3, i cili pritet të dyfishojë performancën e paraardhësit të tij dhe do të fuqizojë një superkompjuter 8 ekzaflops në Dallas.
Cerebras Systems ka zbuluar WSE-3, gjeneratën e tretë të megaçipit të saj të inteligjencës artificiale në shkallë vaferi. Sipas kompanisë, çipi është dy herë më i fuqishëm se paraardhësi i tij, ndërsa konsumon të njëjtën sasi energjie. Me 4 trilion transistorë dhe një rritje prej më shumë se 50 për qind në densitetin e transistorit falë teknologjisë më të fundit të prodhimit të çipave, Cerebras vazhdon traditën e prodhimit të çipit më të madh në botë. Çipi katror, me një gjatësi buzë prej 21.5 centimetrash, përdor pothuajse një meshë silikoni të tërë prej 300 milimetrash.
Që nga megaçipi i parë WSE-1 në 2019, numri i transistorëve është trefishuar. Çipi më i fundit, WSE-3, do të ndërtohet në teknologjinë 5 nanometërshe të TSMC, pasi WSE-2 i vitit 2021 u ndërtua në teknologjinë 7 nanometërshe të kompanisë.
Kompjuteri i ndërtuar rreth çipit të ri të AI, CS-3, thuhet se është në gjendje të trajnojë gjenerata të reja të modeleve të mëdha gjuhësore, dhjetë herë më të mëdha se GPT-4 i OpenAI dhe Gemini i Google . Cerebras pretendon se CS-3 mund të trajnojë modele të rrjeteve nervore me deri në 24 trilion parametra pa pasur nevojë për truket softuerike që kërkojnë kompjuterët e tjerë.
Mund të kombinohen deri në 2048 sisteme, një konfigurim që mund të trajnojë një model gjuhësor si Llama 70B në vetëm një ditë. Superkompjuteri i parë i bazuar në CS-3, Condor Galaxy 3 në Dallas, do të përbëhet nga 64 CS-3 dhe pritet të arrijë 8 ekzaflops të performancës. Ashtu si sistemet e tij simotra të bazuara në CS-2, ai do të jetë në pronësi të G42 të Abu Dhabit .
Cerebras ka hyrë gjithashtu në një partneritet me Qualcomm për të ulur çmimin e konkluzionit të AI me një faktor prej dhjetë. Për ta bërë këtë, ekipi planifikon të trajnojë modelet e AI në sistemet CS-3 dhe më pas t’i bëjë ato më efikase duke përdorur metoda të tilla si krasitja. Rrjetet e trajnuara nga Cerebras do të funksionojnë më pas në çipin e ri të konkluzionit të Qualcomm, AI 100 Ultra.