Cohere lançon një familje modelesh të hapura shumëgjuhëshe

Kompania e inteligjencës artificiale për ndërmarrje, Cohere, lançoi një familje të re modelesh shumëgjuhëshe në kuadër të Samitit të IA-së në Indi që po zhvillohet. Modelet, të quajtura Tiny Aya, janë me peshë të hapur që do të thotë se kodi i tyre themelor është i disponueshëm publikisht për t’u përdorur dhe modifikuar nga kushdo mbështesin mbi 70 gjuhë dhe mund të funksionojnë në pajisje të përditshme si laptopë pa pasur nevojë për lidhje interneti.

Modeli, i lançuar nga krahu kërkimor i kompanisë, Cohere Labs, mbështet gjuhët e Azisë Jugore si bengalisht, hindishte, punjabishte, urdushte, guxharatisht, tamilisht, telugushte dhe maratisht.

Modeli bazë përmban 3.35 miliardë parametra — një masë e madhësisë dhe kompleksitetit të tij. Cohere ka lançuar gjithashtu TinyAya-Global, një version të përshtatur për të ndjekur më mirë komandat e përdoruesit, për aplikacionet që kërkojnë mbështetje të gjerë gjuhësore. Variantet rajonale plotësojnë familjen: TinyAya-Earth për gjuhët afrikane; TinyAya-Fire për gjuhët e Azisë Jugore; dhe TinyAya-Water për Azinë Paqësore, Azinë Perëndimore dhe Evropën.

“Kjo qasje i lejon secilit model të zhvillojë një bazë gjuhësore dhe nuanca kulturore më të forta, duke krijuar sisteme që ndihen më natyrale dhe të besueshme për komunitetet të cilave ato synojnë t’u shërbejnë. Në të njëjtën kohë, të gjitha modelet Tiny Aya ruajnë një mbulim të gjerë shumëgjuhësh, duke i bërë ato pika fillestare fleksibile për përshtatje dhe kërkime të mëtejshme”, tha kompania në një deklaratë.

Cohere vuri në dukje se këto modele, të cilat u trajnuan në një grumbull të vetëm prej 64 GPU-sh H100 (një lloj çipi me fuqi të lartë nga Nvidia) duke përdorur burime relativisht modeste llogaritëse, janë ideale për studiuesit dhe zhvilluesit që ndërtojnë aplikacione për audiencat që flasin gjuhë amtare. Modelet janë të afta të funksionojnë direkt në pajisje, kështu që zhvilluesit mund t’i përdorin ato për të mundësuar përkthimin jashtë linje. Kompania vuri në dukje se e ndërtoi softuerin e saj themelor për t’iu përshtatur përdorimit në pajisje, duke kërkuar më pak fuqi llogaritëse sesa shumica e modeleve të krahasueshme.

Në vende me larmi gjuhësore si India, ky lloj aftësie miqësore për përdoruesit jashtë linje mund të hapë një sërë aplikacionesh dhe rastesh përdorimi të larmishme pa pasur nevojë për qasje të vazhdueshme në internet.

Modelet janë të disponueshme në HuggingFace, platformën popullore për ndarjen dhe testimin e modeleve të IA-së, dhe në Platformën Cohere. Zhvilluesit mund t’i shkarkojnë ato në HuggingFace, Kaggle dhe Ollama për vendosje lokale. Kompania gjithashtu po publikon të dhëna trajnimi dhe vlerësimi në HuggingFace dhe planifikon të publikojë një raport teknik që detajon metodologjinë e saj të trajnimit.

Drejtori ekzekutiv i startup-it, Aidan Gomez, tha vitin e kaluar se kompania planifikon të dalë në bursë “së shpejti”. Sipas CNBC, kompania e mbylli vitin 2025 me një notë të lartë, duke regjistruar 240 milionë dollarë të ardhura vjetore të përsëritura, me një rritje prej 50% nga tremujori në tremujor gjatë gjithë vitit.

Tags: AI, Artificial Intelligence, CNBC, Cohere, Cohere Labs, HuggingFace, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, TechCrunch, Technology, Tiny Aya

Cohere lançon një familje modelesh të hapura shumëgjuhëshe

Mistral prezanton Leanstral 1.5 me kod të hapur, i cili arrin rezultate të shkëlqyera në testet e matematikës formale dhe zbulon gabime reale në kod

Një startup prezanton një modul reaktori bërthamor të printuar në 3D për furnizimin me energji të qendrave të të dhënave për AI

Prodhuesit e çipave i kërkojnë Shtëpisë së Bardhë të shmangë ndërhyrjet e gjera në tregun e memories

Micron nis ndërtimin e zgjerimit prej 9 miliardë dollarësh në Hiroshima për të përmbushur kërkesën për memorie për AI

NASA dhe Red Hat po ndërtojnë një sistem mjekësor me kod të hapur për të diagnostikuar astronautët e sëmurë në ISS

Mistral prezanton Leanstral 1.5 me kod të hapur, i cili arrin rezultate të shkëlqyera në testet e matematikës formale dhe zbulon gabime reale në kod

Polymarket pagoi influencerë për të inskenuar baste fituese në një fushatë marketingu që arriti 140 milionë shikime

Departamenti Amerikan i Energjisë u kërkon qendrave të të dhënave të përdorin gjeneratorët rezervë gjatë valës së të nxehtit, për të liruar energji elektrike për përdorimin e kondicionerëve

Një startup prezanton një modul reaktori bërthamor të printuar në 3D për furnizimin me energji të qendrave të të dhënave për AI

You may have missed

Micron nis ndërtimin e zgjerimit prej 9 miliardë dollarësh në Hiroshima për të përmbushur kërkesën për memorie për AI

NASA dhe Red Hat po ndërtojnë një sistem mjekësor me kod të hapur për të diagnostikuar astronautët e sëmurë në ISS

Mistral prezanton Leanstral 1.5 me kod të hapur, i cili arrin rezultate të shkëlqyera në testet e matematikës formale dhe zbulon gabime reale në kod

Polymarket pagoi influencerë për të inskenuar baste fituese në një fushatë marketingu që arriti 140 milionë shikime

Departamenti Amerikan i Energjisë u kërkon qendrave të të dhënave të përdorin gjeneratorët rezervë gjatë valës së të nxehtit, për të liruar energji elektrike për përdorimin e kondicionerëve

More Stories

You may have missed