New Mistral Small 3 është më i shpejtë dhe më i mirë se modelet e ngjashme të OpenAI dhe Google

foto

Një nga kompanitë kryesore evropiane të inteligjencës artificiale, Mistral AI, ka zbuluar një model të ri të quajtur Mistral Small 3. Është një model me 24 miliardë parametra, por është i barabartë me modelet më të mëdha si Llama 3.3 70B dhe Qwen 32B (të paktën në MMLU – Standardi Pro). Jo vetëm që funksionon në të njëjtin nivel me Llama 3.3 70B, por është edhe më i shpejtë.

Modeli më i përdorur në ChatGPT është GPT-4o mini, modeli i dytë kur përdoruesit mbarojnë kërkesat për GPT-4o. Mistral Small 3 ka performancë më të mirë se ky model OpenAI dhe gjithashtu thuhet se përjeton vonesë më të ulët.

foto

“Ne po lëshojmë një pikë kontrolli të trajnuar dhe të akorduar sipas udhëzimeve nën Apache 2.0,” tha Mistral AI për licencën e modelit. “Pikkat e kontrollit mund të shërbejnë si një bazë e fuqishme për përshpejtimin e progresit. Vini re se Mistral Small 3 nuk është as i trajnuar me RL as të dhëna sintetike, kështu që është më herët në linjën e prodhimit të modeleve sesa modelet si Deepseek R1 (një pjesë e shkëlqyer dhe plotësuese e teknologjisë me burim të hapur!). Mund të shërbejë si një model bazë i shkëlqyeshëm për ndërtimin e kapaciteteve të përllogaritura të arsyetimit. Mezi presim të shohim se si komuniteti me burim të hapur e miraton dhe personalizon atë.”

Si një model në anën më të vogël, është e mundur ta ekzekutoni atë në nivel lokal në kompjuterin tuaj, nëse keni specifika më të larta kompjuteri. Mistral AI tha se mund të ekzekutohet në një kartë grafike të vetme Nvidia RTX 4090 ose një MacBook me 32 GB RAM.

Ndërsa modeli ia doli më mirë kundrejt modeleve të tjera të përmendura në standardin MMLU-Pro, nuk ishte gjithmonë zgjedhja e preferuar e vlerësuesve njerëzorë. Mistral e krahasoi modelin e tij me modelet e tjera në një grup kodimi të pronarit mbi 1k dhe kërkesave të përgjithshme. Ai zbuloi se Mistral Small 3 ishte opsioni i preferuar në krahasim me Gemma-2 27B dhe Qwen-32B, por ishte më pak i preferuar në krahasim me Llama 3.3 70B dhe GPT-4o mini.

foto

Mistral Small 3 tani është i disponueshëm në la Plateforme si mistral-small-i fundit ose mistral-small-2501.