DeepSeek përditëson modelin e tij të arsyetimit R1 me AI dhe e publikon atë në Hugging Face

foto

Startupi kinez DeepSeek ka publikuar një version të përditësuar të modelit të tij të inteligjencës artificiale R1 në platformën e zhvilluesve Hugging Face, pasi e njoftoi atë në një mesazh në WeChat të mërkurën në mëngjes.

foto

R1 i përditësuar, i cili është nën një licencë lejuese MIT, që do të thotë se mund të përdoret komercialisht, është një përmirësim “i vogël”, sipas njoftimit të DeepSeek në WeChat. Depozita Hugging Face nuk përmban një përshkrim të modelit – vetëm skedarë konfigurimi dhe pesha, përbërësit e brendshëm të një modeli që udhëzojnë sjelljen e tij.

foto

Me një madhësi prej 685 miliardë parametrash, modeli i përditësuar R1 është mjaft i rëndë. (“Parametrat” janë sinonim i “peshave”.) Pa modifikim, modeli ka të ngjarë të mos funksionojë në pajisje të nivelit të konsumatorit.

DeepSeek u bë i njohur në fillim të këtij viti pas publikimit të R1, i cili u dha modeleve nga OpenAI një konkurrencë të fortë. Startupi ka ngjallur zemërimin e disa rregullatorëve në SHBA, të cilët argumentojnë se teknologjia e DeepSeek përbën një rrezik për sigurinë kombëtare.