Startup synon të krijojë modelin më të aftë të AI në botë me burim të hapur

Fillimi i inteligjencës artificiale, OthersideAI, ka zbuluar Reflection 70B, një model të ri gjuhësor të optimizuar duke përdorur një teknikë të quajtur “akordim reflektimi”. Kompania planifikon të lëshojë një model edhe më të fuqishëm, Reflection 405B, javën e ardhshme.

Themeluesi i OthersideAI Matt Shumer pretendon se Reflection 70B, i bazuar në Llama 3, është aktualisht modeli më i aftë me burim të hapur në dispozicion. Ai thotë se mund të konkurrojë me modelet më të mira me burim të mbyllur si Claude 3.5 Sonnet dhe GPT-4o.

Shumer pretendon se Reflection 70B tejkalon GPT-4o në disa standarde, duke përfshirë MMLU, MATH, IFEval dhe GSM8K. Ai gjithashtu duket se tejkalon ndjeshëm Llama 3.1 405B.

Shumer i atribuon aftësitë e modelit një metode të re trajnimi të quajtur “akordim reflektimi”. Ky proces me dy faza i mëson modelet të njohin dhe korrigjojnë gabimet e tyre përpara se të japin një përgjigje përfundimtare.

Modeli së pari gjeneron një përgjigje paraprake. Më pas reflekton mbi këtë përgjigje, duke identifikuar gabimet ose mospërputhjet e mundshme dhe prodhon një version të korrigjuar.

Modelet ekzistuese gjuhësore shpesh “halucinojnë” fakte pa e njohur çështjen. Akordimi i reflektimit synon të ndihmojë Reflection 70B të korrigjojë vetë gabime të tilla.

Teknika gjithashtu ndan fazën e planifikimit nga gjenerimi i përgjigjeve. Kjo synon të përmirësojë nxitjen e zinxhirit të mendimit dhe t’i mbajë rezultatet të thjeshta dhe të sakta për përdoruesit fundorë.

Glaive AI siguroi të dhëna trajnimi sintetike për Reflection. “Dua të jem shumë i qartë – GlaiveAI është arsyeja pse kjo funksionoi kaq mirë. Kontrolli që ata ju japin për të gjeneruar të dhëna sintetike është i çmendur,” shkruan Shumer .

Për të shmangur anulimin e rezultateve të standardeve, OthersideAI përdori Dekontaminuesin LLM të Lmsys për të kontrolluar Refleksionin 70B për mbivendosje me grupet e të dhënave të testit.

Tags: AI, Artificial Intelligence, Claude 3.5, Glaive AI, GPT-4o, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, Llama 3, LLM, OthersideAI, Reflection 70B, Sonnet

Startup synon të krijojë modelin më të aftë të AI në botë me burim të hapur

CEO i DeepMind Hassabis thotë se AGI do të vijë si dhjetë revolucione industriale të përmbledhura në një dekadë të vetme

Cohere e Kanadasë dhe Aleph Alpha e Gjermanisë në bisedime për bashkim

Një burrë dyshohet se hodhi një koktej Molotov në shtëpinë e Sam Altman

Mozilla thotë se Microsoft po përdor Copilot dhe Edge për të forcuar kontrollin e tij mbi Windows

Beteja për App Store vazhdon ndërsa Apple dhe Epic përplasen për një pezullim të urdhëruar nga gjykata

CEO i DeepMind Hassabis thotë se AGI do të vijë si dhjetë revolucione industriale të përmbledhura në një dekadë të vetme

Cohere e Kanadasë dhe Aleph Alpha e Gjermanisë në bisedime për bashkim

YouTube thotë se ato kohëmatës prej 90 sekondash për reklamat u shkaktuan nga një gabim

Në ndryshimin më të fundit të drejtimit, Amazon Luna do të heqë blerjet e lojërave dhe dyqanet e palëve të treta

You may have missed

Mozilla thotë se Microsoft po përdor Copilot dhe Edge për të forcuar kontrollin e tij mbi Windows

Beteja për App Store vazhdon ndërsa Apple dhe Epic përplasen për një pezullim të urdhëruar nga gjykata

CEO i DeepMind Hassabis thotë se AGI do të vijë si dhjetë revolucione industriale të përmbledhura në një dekadë të vetme

Cohere e Kanadasë dhe Aleph Alpha e Gjermanisë në bisedime për bashkim

YouTube thotë se ato kohëmatës prej 90 sekondash për reklamat u shkaktuan nga një gabim

More Stories

You may have missed