Modeli i madh gjuhësor i Alibaba kryeson renditjen globale të platformës së zhvilluesve të AI Hugging Face

foto

Familja e modeleve të gjuhëve të mëdha (LLM) të Alibaba Group Holding – teknologjia që mbështet shërbimet gjeneruese të inteligjencës artificiale (AI) si ChatGPT – është renditur ndër 10 modelet më të mira në botë me burim të hapur.

Tre nga katër LLM-të më të mirë kinezë të renditur në 10 ishin nga seria Tongyi Qianwen , e njohur gjithashtu si Qwen, e zhvilluar nga gjigandi i tregtisë elektronike dhe kompjuterit cloud Alibaba, sipas AI dhe platformës së zhvilluesve të mësimit të makinerive Hugging Face, e cila publikoi tabelën e saj të përditësuar të drejtuesve. me metrika të reja të mërkurën. Alibaba zotëron South China Morning Post.

Qwen-72B-Instruct LLM i Alibaba me bazë në Hangzhou kryesoi listën me një rezultat mesatar prej 43.02 në gjashtë standarde. Ky model Qwen u trajnua mbi 72 miliardë “parametra” – një term i mësimit të makinës për variablat e pranishme në një sistem AI gjatë trajnimit, i cili ndihmon në përcaktimin se si kërkesat e të dhënave japin rezultatin e dëshiruar.

“Qwen 72B [Instruct] është mbreti dhe modelet e hapura kineze po dominojnë në përgjithësi,” tha bashkëthemeluesi dhe shefi ekzekutiv i Hugging Face, Clement Delangue në një postim në X, dikur Twitter, të mërkurën.

foto

Ky model i veçantë Qwen u vlerësua për “performancën e tij në matematikë, arsyetimin me rreze të gjatë dhe njohuritë”, sipas postimit të së mërkurës në faqen e internetit të komunitetit të zhvilluesve Hugging Face.

Ndërkohë, modelet Qwen-72B dhe Qwen1.5-110B të Alibaba dolën në vendin e tretë dhe të dhjetë, përkatësisht, që nga e enjtja. Renditja pritet të ndryshojë me kalimin e kohës, pasi më shumë LLM vlerësohen, sipas Hugging Face.

Modeli Yi-1.5-34B-Chat nga start-up- i 01.AI me bazë në Pekin u rendit i shtati. Firma u themelua në vitin 2023 nga kapitalisti i shquar i sipërmarrjes Lee Kai-fu, i cili më parë ishte president në Google China.

Njohja e lartë e LLM-ve të Alibaba tregon përparimin e shpejtë të kompanisë në AI në anën e pasme të angazhimit të saj të fortë për zhvillimin me burim të hapur . Tongyi Qianwen u hap për zhvilluesit e palëve të treta për disa muaj tashmë.

Burimi i hapur i jep publikut akses në kodin burimor të një programi, duke lejuar zhvilluesit e softuerit të palëve të treta të modifikojnë ose ndajnë dizajnin e tij, të rregullojnë lidhjet e prishura ose të rrisin aftësitë e tij. Teknologjitë me burim të hapur kanë qenë një kontribues i madh në industrinë e lulëzuar të teknologjisë në Kinë gjatë dekadave të fundit.

foto

Modeli mëmë i inteligjencës artificiale të Meta Platforms në Facebook zuri vendin e dytë pas Alibaba në listën e top 10 të Hugging Face. Një LLM nga Microsoft, një mbështetës i madh i krijuesit të ChatGPT OpenAI, u rendit i gjashti.

Komuniteti Hugging Face tha të mërkurën se metodologjia e tij për renditjen e modeleve të inteligjencës artificiale shtoi më shumë metrikë, siç janë problemet komplekse prej rreth 1,000 fjalësh në gjatësi, në një kohë kur “performancat e AI janë duke u ulur”.

Meqenëse renditja e Hugging Face është e përqendruar në programe të zhvilluara me burim të hapur, ai përjashton LLM-të e avancuara të zhvilluara në një mjedis të pronarit si GPT i OpenAI.

Renditja e LMSYS Chatbot Arena nga Universiteti i Kalifornisë, Berkeley, dhe Organizata e Sistemeve të Modeleve të Mëdha u krye nga GPT-4o, LLM e fundit e OpenAI e prezantuar në maj. Qwen2-72B-Instruct i Alibaba u rendit i 19-ti.