Mistral lëshon Codestral Mamba për gjenerim më të shpejtë dhe më të gjatë të kodit

foto

Fillesa franceze e mirëfinancuar e inteligjencës artificiale Mistral, e njohur për modelet e saj të fuqishme të inteligjencës artificiale me burim të hapur, lançoi sot dy hyrje të reja në familjen e saj në rritje të modeleve të gjuhëve të mëdha (LLM): një model të bazuar në matematikë dhe një model që gjeneron kode për programuesit dhe zhvilluesit e bazuar. mbi arkitekturën e re të njohur si Mamba e zhvilluar nga studiues të tjerë në fund të vitit të kaluar.

foto

Mamba kërkon të përmirësojë efikasitetin e arkitekturës së transformatorit të përdorur nga shumica e LLM-ve kryesore duke thjeshtuar mekanizmat e vëmendjes. Modelet e bazuara në Mamba, ndryshe nga ato më të zakonshme të bazuara në transformator, mund të kenë kohë më të shpejta të përfundimit dhe kontekst më të gjatë. Kompani të tjera dhe zhvillues, përfshirë AI21, kanë lëshuar modele të reja të AI bazuar në të.

foto

Tani, duke përdorur këtë arkitekturë të re, i quajtur me vend Codestral Mamba 7B i Mistral ofron një kohë të shpejtë përgjigjeje edhe me tekste më të gjata hyrëse. Codestral Mamba funksionon mirë për rastet e përdorimit të produktivitetit të kodit, veçanërisht për më shumë projekte të kodimit lokal.

Mistral testoi modelin, i cili do të jetë falas për t’u përdorur në Mistral’s l a Plateforme API, duke trajtuar inpute deri në 256,000 token – dyfishi i asaj të GPT-4o të OpenAI.

Në testet e krahasimit, Mistral tregoi se Codestral Mamba doli më mirë se modelet rivale me kod të hapur CodeLlama 7B, CodeGemma-1.17B dhe DeepSeek në testet HumanEval.

Zhvilluesit mund të modifikojnë dhe vendosin Codestral Mamba nga depoja e tij GitHub dhe përmes HuggingFace. Ai do të jetë i disponueshëm me një licencë Apache 2.0 me burim të hapur.

Mistral pretendoi se versioni i mëparshëm i Codestral i tejkaloi gjeneruesit e tjerë të kodit si CodeLlama 70B dhe DeepSeek Coder 33B.

Gjenerimi i kodit dhe asistentët e kodimit janë bërë aplikacione të përdorura gjerësisht për modelet e AI, me platforma si GitHub’s Copilot, të mundësuara nga OpenAI, CodeWhisperer të Amazon dhe Codenium duke fituar popullaritet.

Lansimi i dytë i modelit të Mistral është Mathstral 7B, një model i AI i krijuar posaçërisht për arsyetimin e lidhur me matematikën dhe zbulimin shkencor. Mistral zhvilloi Mathstral me Projektin Numina.

Mathstral ka një dritare konteksti 32K dhe do të jetë nën një licencë Apache 2.0 me burim të hapur. Mistral tha se modeli tejkaloi çdo model të krijuar për arsyetimin matematikor. Mund të arrijë “rezultate dukshëm më të mira” në standardet me më shumë llogaritje në kohën e përfundimit. Përdoruesit mund ta përdorin atë siç është ose ta rregullojnë modelin.

“Mathstral është një shembull tjetër i kompromiseve të shkëlqyera të performancës/shpejtësisë që arrihet kur ndërtojmë modele për qëllime specifike – një filozofi zhvillimi që ne promovojmë në mënyrë aktive në la Plateforme, veçanërisht me aftësitë e reja të rregullimit të imët”, tha Mistral në një postim në blog.

Mathstral mund të arrihet përmes Mistral’s la Plataforme dhe HuggingFace.

Mistral, i cili tenton të ofrojë modelet e tij në një sistem me burim të hapur, ka konkurruar në mënyrë të qëndrueshme kundër zhvilluesve të tjerë të AI si OpenAI dhe Anthropic.

Së fundmi ajo mblodhi 640 milionë dollarë financime të serisë B, duke e çuar vlerësimin e saj afër 6 miliardë dollarëve. Kompania gjithashtu mori investime nga gjigantët e teknologjisë si Microsoft dhe IBM.