Alibaba prezanton Qwen2.5-VL-32B, një model AI më të zgjuar dhe më të lehtë

Alibaba ka lançuar një model të ri të inteligjencës artificiale, Qwen2.5-VL-32B-Instruct, një version i optimizuar i serisë Qwen2.5-VL që u shfaq në fund të janarit të këtij viti. Modeli i ri, i cili lëshohet nën licencën Apache 2.0, është projektuar për të ofruar përgjigje më të detajuara dhe të strukturuara mirë që përputhen më afër me preferencat njerëzore.

Modeli Qwen2.5-VL-32B-Instruct krenohet me përmirësime të rëndësishme në saktësinë e arsyetimit matematik. Ai gjithashtu shfaq aftësi të zgjeruara në kuptimin dhe arsyetimin e hollësishëm të imazhit, duke përfshirë detyra të tilla si analizimi i imazhit, njohja e përmbajtjes dhe zbritja e logjikës vizuale.

Modeli i ri ka demonstruar performancë superiore ndaj modeleve të krahasueshme moderne, duke përfshirë Mistral-Small-3.1-24B dhe Gemma-3-27B-IT. Ai gjithashtu tejkalon modelin më të madh Qwen2-VL-72B-Instruct, veçanërisht në detyrat multimodale si MMMU, MMMU-Pro dhe MathVista, të cilat kërkojnë arsyetim kompleks, me shumë hapa. Në MM-MT-Bench, një pikë referimi për vlerësimin e përvojës së përdoruesit, Qwen2.5-VL-32B-Instruct e tejkaloi ndjeshëm paraardhësin e tij.
Përveç aftësive të tij vizuale, Qwen2.5-VL-32B-Instruct ka arritur performancë të nivelit të lartë në aftësitë e tekstit të pastër në të njëjtën shkallë.
Drejtimi i ardhshëm i kërkimit të Alibaba do të fokusohet në përmirësimin e proceseve të gjata dhe efektive të arsyetimit. Kjo lëvizje strategjike synon të përmirësojë performancën e modeleve vizuale në trajtimin e detyrave shumë komplekse, me shumë hapa të arsyetimit vizual.