Startup synon të krijojë modelin më të aftë të AI në botë me burim të hapur

Fillimi i inteligjencës artificiale, OthersideAI, ka zbuluar Reflection 70B, një model të ri gjuhësor të optimizuar duke përdorur një teknikë të quajtur “akordim reflektimi”. Kompania planifikon të lëshojë një model edhe më të fuqishëm, Reflection 405B, javën e ardhshme.

Themeluesi i OthersideAI Matt Shumer pretendon se Reflection 70B, i bazuar në Llama 3, është aktualisht modeli më i aftë me burim të hapur në dispozicion. Ai thotë se mund të konkurrojë me modelet më të mira me burim të mbyllur si Claude 3.5 Sonnet dhe GPT-4o.

Shumer pretendon se Reflection 70B tejkalon GPT-4o në disa standarde, duke përfshirë MMLU, MATH, IFEval dhe GSM8K. Ai gjithashtu duket se tejkalon ndjeshëm Llama 3.1 405B.

Shumer i atribuon aftësitë e modelit një metode të re trajnimi të quajtur “akordim reflektimi”. Ky proces me dy faza i mëson modelet të njohin dhe korrigjojnë gabimet e tyre përpara se të japin një përgjigje përfundimtare.

Modeli së pari gjeneron një përgjigje paraprake. Më pas reflekton mbi këtë përgjigje, duke identifikuar gabimet ose mospërputhjet e mundshme dhe prodhon një version të korrigjuar.

Modelet ekzistuese gjuhësore shpesh “halucinojnë” fakte pa e njohur çështjen. Akordimi i reflektimit synon të ndihmojë Reflection 70B të korrigjojë vetë gabime të tilla.

Teknika gjithashtu ndan fazën e planifikimit nga gjenerimi i përgjigjeve. Kjo synon të përmirësojë nxitjen e zinxhirit të mendimit dhe t’i mbajë rezultatet të thjeshta dhe të sakta për përdoruesit fundorë.

Glaive AI siguroi të dhëna trajnimi sintetike për Reflection. “Dua të jem shumë i qartë – GlaiveAI është arsyeja pse kjo funksionoi kaq mirë. Kontrolli që ata ju japin për të gjeneruar të dhëna sintetike është i çmendur,” shkruan Shumer .

Për të shmangur anulimin e rezultateve të standardeve, OthersideAI përdori Dekontaminuesin LLM të Lmsys për të kontrolluar Refleksionin 70B për mbivendosje me grupet e të dhënave të testit.

Tags: AI, Artificial Intelligence, Claude 3.5, Glaive AI, GPT-4o, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, Llama 3, LLM, OthersideAI, Reflection 70B, Sonnet

Startup synon të krijojë modelin më të aftë të AI në botë me burim të hapur

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

OpenAI mbyll shfletuesin Atlas vetëm tetë muaj pas lançimit dhe integron të gjitha funksionet e tij në ChatGPT

OpenAI publikon GPT-5.6 dhe mjetin ChatGPT Work

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

Gjigantët e teknologjisë marrin 350 miliardë dollarë borxh për të financuar garën për qendrat e të dhënave të inteligjencës artificiale

Google u shiti modele të inteligjencës artificiale kompanive kineze të sanksionuara

Anëtarët e rinj të grupit të punës të Fed ndajnë mbështetjen e kryetarit Kevin Warsh për inteligjencën artificiale

Phia akuzohet për ‘cookie stuffing’, duke përvetësuar komisione nga blerje që nuk i kishte siguruar vetë

Meta tërheq funksionin e AI në Instagram vetëm pak ditë pas lançimit

You may have missed

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

Gjigantët e teknologjisë marrin 350 miliardë dollarë borxh për të financuar garën për qendrat e të dhënave të inteligjencës artificiale

Google u shiti modele të inteligjencës artificiale kompanive kineze të sanksionuara

Anëtarët e rinj të grupit të punës të Fed ndajnë mbështetjen e kryetarit Kevin Warsh për inteligjencën artificiale

Phia akuzohet për ‘cookie stuffing’, duke përvetësuar komisione nga blerje që nuk i kishte siguruar vetë

More Stories

You may have missed