Nvidia sapo ka lëshuar një gjenerator të ri kodi që mund të funksionojë në shumicën e CPU-ve moderne

Nvidia është bashkuar me ServiceNow dhe Hugging Face për të prezantuar një familje të re të modeleve të gjuhëve të mëdha me akses të hapur (LLM) për gjenerimin e kodit.

foto

Platforma StarCoder2 u zhvillua nga komuniteti BigCode duke marrë parasysh performancën, transparencën dhe efektivitetin e kostos.

foto

Shtrirja e gjerë e StarCoder2 bazohet në trajnimin e 619 gjuhëve programuese. Gjeneruesi i kodit të AI vjen në tre shije: 3 miliardë, 7 miliardë dhe 15 miliardë parametra.

Sipas njoftimit, variantet më të vogla u krijuan për të ofruar performancë të fortë gjatë menaxhimit të kostove llogaritëse. Modeli më i vogël u ndërtua së bashku me ServiceNow dhe premton të përputhet me performancën e opsionit origjinal me 15 miliardë parametra të StarCoder-it, ndërsa opsioni me specifikim të mesëm merr mbështetjen e Hugging Face.

Opsioni prej 15 miliardë parametrash i StarCoder2 u trajnua në infrastrukturën e përshpejtuar Nvidia.

Përmirësimet e konsiderueshme nënkuptojnë se, ndërsa performanca më e madhe mund të zhbllokohet nga opsioni i përshpejtuar nga Nvidia, edhe varianti më themelor është një përparim i konsiderueshëm në gjeneratat e mëparshme dhe kërkon infrastrukturë më pak të sofistikuar.

Jonathan Cohen, VP për Kërkime të Aplikuara në Nvidia. “Bashkëpunimi i Nvidia me ServiceNow dhe Hugging Face prezanton modele të sigurta, të zhvilluara me përgjegjësi dhe mbështet akses më të gjerë në AI gjeneruese të përgjegjshme që shpresojmë se do të përfitojë komunitetin global.”

Për më tepër, StarCoder2 përdor një grup të ri të dhënash kodi të quajtur The Stack v2, i cili përfshin teknika të reja trajnimi për të kuptuar gjuhët e programimit me burime të ulëta, matematikën dhe diskutimet e kodit burimor të programit.

Përveç përmirësimeve të performancës dhe efikasitetit, organizatat këmbëngulin që StarCoder2 t’u përmbahet praktikave etike të AI, të tilla si përdorimi i të dhënave me burim të përgjegjshëm nën licencë nga të përbashkëtat dixhitale të Trashëgimisë së Softuerit. Zhvilluesit gjithashtu mund të zgjedhin që të dhënat e tyre të përdoren për trajnime.