Cohere lançon një familje modelesh të hapura shumëgjuhëshe
Kompania e inteligjencës artificiale për ndërmarrje, Cohere, lançoi një familje të re modelesh shumëgjuhëshe në kuadër të Samitit të IA-së në Indi që po zhvillohet. Modelet, të quajtura Tiny Aya, janë me peshë të hapur që do të thotë se kodi i tyre themelor është i disponueshëm publikisht për t’u përdorur dhe modifikuar nga kushdo mbështesin mbi 70 gjuhë dhe mund të funksionojnë në pajisje të përditshme si laptopë pa pasur nevojë për lidhje interneti.
Modeli, i lançuar nga krahu kërkimor i kompanisë, Cohere Labs, mbështet gjuhët e Azisë Jugore si bengalisht, hindishte, punjabishte, urdushte, guxharatisht, tamilisht, telugushte dhe maratisht.
Modeli bazë përmban 3.35 miliardë parametra — një masë e madhësisë dhe kompleksitetit të tij. Cohere ka lançuar gjithashtu TinyAya-Global, një version të përshtatur për të ndjekur më mirë komandat e përdoruesit, për aplikacionet që kërkojnë mbështetje të gjerë gjuhësore. Variantet rajonale plotësojnë familjen: TinyAya-Earth për gjuhët afrikane; TinyAya-Fire për gjuhët e Azisë Jugore; dhe TinyAya-Water për Azinë Paqësore, Azinë Perëndimore dhe Evropën.

“Kjo qasje i lejon secilit model të zhvillojë një bazë gjuhësore dhe nuanca kulturore më të forta, duke krijuar sisteme që ndihen më natyrale dhe të besueshme për komunitetet të cilave ato synojnë t’u shërbejnë. Në të njëjtën kohë, të gjitha modelet Tiny Aya ruajnë një mbulim të gjerë shumëgjuhësh, duke i bërë ato pika fillestare fleksibile për përshtatje dhe kërkime të mëtejshme”, tha kompania në një deklaratë.
Cohere vuri në dukje se këto modele, të cilat u trajnuan në një grumbull të vetëm prej 64 GPU-sh H100 (një lloj çipi me fuqi të lartë nga Nvidia) duke përdorur burime relativisht modeste llogaritëse, janë ideale për studiuesit dhe zhvilluesit që ndërtojnë aplikacione për audiencat që flasin gjuhë amtare. Modelet janë të afta të funksionojnë direkt në pajisje, kështu që zhvilluesit mund t’i përdorin ato për të mundësuar përkthimin jashtë linje. Kompania vuri në dukje se e ndërtoi softuerin e saj themelor për t’iu përshtatur përdorimit në pajisje, duke kërkuar më pak fuqi llogaritëse sesa shumica e modeleve të krahasueshme.

Në vende me larmi gjuhësore si India, ky lloj aftësie miqësore për përdoruesit jashtë linje mund të hapë një sërë aplikacionesh dhe rastesh përdorimi të larmishme pa pasur nevojë për qasje të vazhdueshme në internet.
Modelet janë të disponueshme në HuggingFace, platformën popullore për ndarjen dhe testimin e modeleve të IA-së, dhe në Platformën Cohere. Zhvilluesit mund t’i shkarkojnë ato në HuggingFace, Kaggle dhe Ollama për vendosje lokale. Kompania gjithashtu po publikon të dhëna trajnimi dhe vlerësimi në HuggingFace dhe planifikon të publikojë një raport teknik që detajon metodologjinë e saj të trajnimit.
Drejtori ekzekutiv i startup-it, Aidan Gomez, tha vitin e kaluar se kompania planifikon të dalë në bursë “së shpejti”. Sipas CNBC, kompania e mbylli vitin 2025 me një notë të lartë, duke regjistruar 240 milionë dollarë të ardhura vjetore të përsëritura, me një rritje prej 50% nga tremujori në tremujor gjatë gjithë vitit.
