Google rishqyrton garën e modeleve të inteligjencës artificiale me Gemma 4

foto

Sot, po prezantojmë Gemma 4 modelet tona të hapura më inteligjente deri më sot. E ndërtuar posaçërisht për arsyetim të avancuar dhe rrjedha pune agjentike, Gemma 4 ofron një nivel të paparë inteligjence për parametër. Ky përparim mbështetet në vrullin e jashtëzakonshëm të komunitetit: që nga lançimi i gjeneratës sonë të parë, zhvilluesit e kanë shkarkuar Gemma-n mbi 400 milionë herë, duke ndërtuar një Gemmaverse të gjallë me më shumë se 100,000 variante. Ne dëgjuam me vëmendje se çfarë u nevojitet inovatorëve për të shtyrë kufijtë e IA-së, dhe Gemma 4 është përgjigjja jonë: aftësi përparimtare të bëra gjerësisht të arritshme sipas një licence Apache 2.0.

foto

I ndërtuar nga i njëjti kërkim dhe teknologji e nivelit botëror si Gemini 3, Gemma 4 është familja e modeleve më të afta që mund të përdorni në harduerin tuaj. Ato plotësojnë modelet tona Gemini, duke u dhënë zhvilluesve kombinimin më të fuqishëm në industri të mjeteve të hapura dhe atyre pronësore.

Po e publikojmë Gemma 4 në katër madhësi të gjithanshme: Efektive 2B (E2B ), Efektive 4B (E4B) , 26B Përzierje Ekspertësh (MoE) dhe 31B Dense. E gjithë familja shkon përtej bisedave të thjeshta për të trajtuar logjikën komplekse dhe rrjedhat e punës agjentike. Modelet tona më të mëdha ofrojnë performancë të teknologjisë së fundit për madhësitë e tyre, me modelin 31B që renditet aktualisht si modeli i hapur #3 në botë në tabelën standarde të industrisë të tekstit Arena AI, dhe modelin 26B që siguron vendin #6. Atje, Gemma 4 i tejkalon modelet 20 herë më të mëdha se vetja. Për zhvilluesit, ky nivel i ri inteligjence për parametër do të thotë arritje e aftësive të nivelit kufitar me kosto dukshëm më të ulët hardueri.

Në skajet e tregut, modelet tona E2B dhe E4B ripërcaktojnë dobinë në pajisje, duke i dhënë përparësi aftësive multimodale, përpunimit me vonesë të ulët dhe integrimit të përsosur të ekosistemit mbi numërimin e parametrave të papërpunuar.

Për të fuqizuar gjeneratën e ardhshme të kërkimeve dhe produkteve pioniere, ne i kemi dimensionuar modelet Gemma 4 posaçërisht për të funksionuar dhe përshtatur në mënyrë efikase në harduer – nga miliarda pajisje Android në të gjithë botën, te GPU-të e laptopëve, deri te stacionet e punës dhe përshpejtuesit e zhvilluesve.

Duke përdorur këto modele shumë të optimizuara, ju mund ta përshtatni Gemma 4 për të arritur performancë të nivelit të lartë në detyrat tuaja specifike. Ne kemi parë tashmë sukses të jashtëzakonshëm me këtë qasje; për shembull, INSAIT krijoi një model pionier të gjuhës bullgarisht-e para ( BgGPT ), dhe ne punuam me Universitetin Yale në Cell2Sentence-Scale për të zbuluar rrugë të reja për terapinë e kancerit, ndër shumë të tjera.

Ja çfarë e bën Gemma 4 familjen tonë më të aftë të modeleve të hapura deri më tani:

Arsyetim i avancuar: E aftë për planifikim shumëhapësh dhe logjikë të thellë, Gemma 4 demonstron përmirësime të konsiderueshme në matematikë dhe në standardet e ndjekjes së mësimdhënies që e kërkojnë këtë.
Flukset e punës agjentike: Mbështetja native për thirrjen e funksioneve, daljen e strukturuar JSON dhe udhëzimet e sistemit native ju mundësojnë të ndërtoni agjentë autonomë që mund të bashkëveprojnë me mjete dhe API të ndryshme dhe të ekzekutojnë rrjedhat e punës në mënyrë të besueshme.
Gjenerimi i kodit: Gemma 4 mbështet kod jashtë linje me cilësi të lartë, duke e shndërruar stacionin tuaj të punës në një asistent kodi të inteligjencës artificiale me fokus lokal.
Pamje dhe audio: Të gjitha modelet përpunojnë në mënyrë native video dhe imazhe, duke mbështetur rezolucione të ndryshueshme dhe duke shkëlqyer në detyra vizuale si OCR dhe kuptimi i grafikëve. Përveç kësaj, modelet E2B dhe E4B kanë hyrje audio native për njohjen dhe kuptimin e të folurit.
Kontekst më i gjatë: Përpunoni përmbajtje të gjatë pa probleme. Modelet Edge kanë një dritare konteksti prej 128K, ndërsa modelet më të mëdha ofrojnë deri në 256K, duke ju lejuar të kaloni depo ose dokumente të gjata në një njoftim të vetëm.
Mbi 140 gjuhë: I trajnuar nativisht në mbi 140 gjuhë, Gemma 4 i ndihmon zhvilluesit të ndërtojnë aplikacione gjithëpërfshirëse dhe me performancë të lartë për një audiencë globale.

Po publikojmë peshat e modelit Gemma 4 në madhësi të përshtatura për harduer dhe raste përdorimi specifike, duke siguruar që të merrni arsyetim të klasit të parë kudo që ju nevojitet:

Të optimizuara për t’u ofruar studiuesve dhe zhvilluesve arsyetimin më të fundit mbi harduerin e aksesueshëm, peshat tona të pakuantizuara bfloat16 përshtaten në mënyrë efikase në një GPU të vetme NVIDIA H100 prej 80 GB. Për konfigurimet lokale, versionet e kuantizuara funksionojnë në mënyrë native në GPU-të e konsumatorëve për të fuqizuar IDE-të, asistentët e kodimit dhe rrjedhat e punës agjentike. Përzierja jonë 26B e Ekspertëve (MoE) përqendrohet në vonesë, duke aktivizuar vetëm 3.8 miliardë nga parametrat e saj totalë gjatë nxjerrjes së përfundimeve për të ofruar tokena jashtëzakonisht të shpejtë për sekondë, ndërsa Dense jonë 31B po maksimizon cilësinë e papërpunuar dhe ofron një bazë të fuqishme për rregullim të imët.

foto

Të projektuara nga themeli për efikasitet maksimal të llogaritjes dhe memories, këto modele aktivizojnë një gjurmë efektive prej 2 miliardë dhe 4 miliardë parametrash gjatë nxjerrjes së përfundimeve për të ruajtur RAM-in dhe jetëgjatësinë e baterisë. Në bashkëpunim të ngushtë me ekipin tonë të Google Pixel dhe liderët e pajisjeve mobile si Qualcomm Technologies dhe MediaTek, këto modele multimodale funksionojnë plotësisht jashtë linje me vonesë pothuajse zero në pajisjet edge si telefonat, Raspberry Pi dhe NVIDIA Jetson Orin Nano. Zhvilluesit e Android tani mund të prototipojnë rrjedha agjentësh në AICore Developer Preview sot për pajtueshmëri të mëtejshme me Gemini Nano 4.

Na dhatë reagime dhe ne ju dëgjuam. Ndërtimi i së ardhmes së inteligjencës artificiale kërkon një qasje bashkëpunuese dhe ne besojmë në fuqizimin e ekosistemit të zhvilluesve pa pengesa kufizuese. Kjo është arsyeja pse Gemma 4 është publikuar sipas një licence Apache 2.0 që lejon biznesin.

Kjo licencë me burim të hapur ofron një bazë për fleksibilitet të plotë për zhvilluesit dhe sovranitet dixhital; duke ju dhënë kontroll të plotë mbi të dhënat, infrastrukturën dhe modelet tuaja. Ju lejon të ndërtoni dhe të vendosni në mënyrë të sigurt në çdo mjedis, qoftë në ambientet tuaja apo në cloud.

Këto modele i nënshtrohen të njëjtave protokolle rigoroze të sigurisë së infrastrukturës si modelet tona pronësore. Duke zgjedhur Gemma 4, ndërmarrjet dhe organizatat sovrane fitojnë një themel të besueshëm dhe transparent që ofron aftësi të teknologjisë së fundit, duke përmbushur standardet më të larta për sigurinë dhe besueshmërinë.