Apple hyn në Arenën e Hapur të AI me CoreNet dhe OpenELM

foto

Apple ka prezantuar CoreNet, një bibliotekë të re për trajnimin e rrjeteve të thella nervore, dhe OpenELM, një familje moderne e modeleve të gjuhëve të hapura. Modelet janë tani të disponueshme në qendrën Hugging Face, së bashku me kornizën e plotë për trajnimin dhe vlerësimin në grupet e të dhënave të disponueshme publikisht.

foto

CoreNet, i disponueshëm në GitHub, është një vegël e gjithanshme që mbështet detyra të ndryshme, duke përfshirë zbulimin e objekteve dhe segmentimin semantik. Modelet OpenELM, të ndërtuara duke përdorur CoreNet, arrijnë saktësi të shtuar përmes shpërndarjes efikase të parametrave brenda modelit të tij të transformatorit. Apple ka lëshuar modele të paratrajnuara dhe të akorduara me udhëzime me parametra 270M, 450M, 1.1B dhe 3B.

Ajo që e veçon OpenELM është strategjia e tij e shkallëzimit sipas shtresave. Kjo metodë përdor përmasa më të vogla latente në modulet e vëmendjes dhe të shtyrjes përpara të shtresave të transformatorit më afër hyrjes, duke u zgjeruar gradualisht ndërsa ato i afrohen daljes. Kjo qasje lejon përdorimin më efikas të buxhetit të parametrave, duke rezultuar në saktësi të përmirësuar në krahasim me modelet ekzistuese.

Veçanërisht, varianti prej 1 miliard parametrash i OpenELM tejkalon modelin e krahasueshëm OLMo me 2.36% ndërsa kërkon vetëm gjysmën e argumenteve të para-stërvitjes. Megjithatë, ajo ende bie në mënyrë të konsiderueshme prapa modeleve të gjuhëve të vogla Phi-3 të lëshuar së fundmi nga Microsoft.

foto

Lëshimi i CoreNet dhe OpenELM nga Apple është një kontribut i rëndësishëm për komunitetin e kërkimit të hapur dhe i pari për gjigantin Cupertino. Kompania nuk është vetëm me burime të hapura për peshat e modelit dhe kodin e konkluzioneve, por edhe regjistrat e trajnimit, pikat e kontrollit dhe konfigurimet e para-stërvitjes. Ata gjithashtu kanë lëshuar kodin për konvertimin e modeleve në bibliotekën MLX për konkluzionet efikase dhe rregullimin e saktë në pajisjet Apple.

Vendimi i Apple për OpenELM me burim të hapur mund të ndikohet nga rritja e popullaritetit dhe suksesit të kolegëve të tij, si Google, Microsoft dhe Meta, të cilët të gjithë kanë kontribuar me modele të hapura të fundit në komunitetin e AI. Lëvizja e Apple pasqyron nevojën për të mbetur konkurrues dhe i rëndësishëm në një industri që vlerëson gjithnjë e më shumë jo vetëm inovacionin, por edhe aksesin dhe bashkëpunimin e komunitetit.

Për më tepër, fokusi i Apple në modelet me parametra të vegjël, si OpenELM, përputhet me strategjinë e tij për të ekzekutuar AI në nivel lokal në pajisje dhe jo në cloud. Kjo qasje jo vetëm që rrit privatësinë e përdoruesit, por gjithashtu mundëson konkluzionet efikase në pajisje, gjë që është thelbësore për ekosistemin e produkteve dhe shërbimeve të Apple.