Startup synon të krijojë modelin më të aftë të AI në botë me burim të hapur
Fillimi i inteligjencës artificiale, OthersideAI, ka zbuluar Reflection 70B, një model të ri gjuhësor të optimizuar duke përdorur një teknikë të quajtur “akordim reflektimi”. Kompania planifikon të lëshojë një model edhe më të fuqishëm, Reflection 405B, javën e ardhshme.
Themeluesi i OthersideAI Matt Shumer pretendon se Reflection 70B, i bazuar në Llama 3, është aktualisht modeli më i aftë me burim të hapur në dispozicion. Ai thotë se mund të konkurrojë me modelet më të mira me burim të mbyllur si Claude 3.5 Sonnet dhe GPT-4o.
Shumer pretendon se Reflection 70B tejkalon GPT-4o në disa standarde, duke përfshirë MMLU, MATH, IFEval dhe GSM8K. Ai gjithashtu duket se tejkalon ndjeshëm Llama 3.1 405B.
Shumer i atribuon aftësitë e modelit një metode të re trajnimi të quajtur “akordim reflektimi”. Ky proces me dy faza i mëson modelet të njohin dhe korrigjojnë gabimet e tyre përpara se të japin një përgjigje përfundimtare.
Modeli së pari gjeneron një përgjigje paraprake. Më pas reflekton mbi këtë përgjigje, duke identifikuar gabimet ose mospërputhjet e mundshme dhe prodhon një version të korrigjuar.
Modelet ekzistuese gjuhësore shpesh “halucinojnë” fakte pa e njohur çështjen. Akordimi i reflektimit synon të ndihmojë Reflection 70B të korrigjojë vetë gabime të tilla.
Teknika gjithashtu ndan fazën e planifikimit nga gjenerimi i përgjigjeve. Kjo synon të përmirësojë nxitjen e zinxhirit të mendimit dhe t’i mbajë rezultatet të thjeshta dhe të sakta për përdoruesit fundorë.
Glaive AI siguroi të dhëna trajnimi sintetike për Reflection. “Dua të jem shumë i qartë – GlaiveAI është arsyeja pse kjo funksionoi kaq mirë. Kontrolli që ata ju japin për të gjeneruar të dhëna sintetike është i çmendur,” shkruan Shumer .
Për të shmangur anulimin e rezultateve të standardeve, OthersideAI përdori Dekontaminuesin LLM të Lmsys për të kontrolluar Refleksionin 70B për mbivendosje me grupet e të dhënave të testit.