Apple publikon detaje rreth modelit të ri MM1 të AI

Studiuesit e Apple kanë zhvilluar një metodë të re për trajnimin e modeleve të mëdha gjuhësore (LLM) që integron pa probleme si tekstin ashtu edhe informacionin vizual.

foto

Gjetjet e kompanisë, të detajuara në një punim kërkimor të titulluar ” MM1: Metodat, Analiza & Vështrime nga Paratrajnimi Multimodal LLM “, tregojnë një qasje të re për krijimin e sistemeve më inteligjente dhe fleksibël të AI. Duke përdorur një grup të dhënash të larmishme që përfshin çifte titrat imazhi, dokumente të ndërlidhura me tekstin e imazhit dhe të dhëna vetëm me tekst, pretendimet e Apple se modeli MM1 vendos një standard të ri në aftësinë e AI për të kryer detyra të tilla si titrimi i imazheve, përgjigjja vizuale e pyetjeve dhe natyrale. konkluzionet gjuhësore me një nivel të lartë saktësie.

foto

Hulumtimi i Apple fokusohet në kombinimin e llojeve të ndryshme të të dhënave të trajnimit dhe arkitekturave të modeleve, gjë që i mundëson AI të kuptojë dhe gjenerojë gjuhën bazuar në një përzierje të sinjaleve vizuale dhe gjuhësore. Kjo aftësi është jetike për detyrat që kërkojnë një kuptim të nuancuar të botës, të tilla si interpretimi i imazheve komplekse ose përgjigjja e pyetjeve që përfshijnë elemente vizuale.

Punimi thekson gjithashtu aftësitë e jashtëzakonshme të të mësuarit në kontekst të modelit MM1, veçanërisht në konfigurimin më të madh të parametrave prej 30 miliardë të modelit. Ky version me sa duket shfaq aftësi të jashtëzakonshme për arsyetimin me shumë hapa mbi imazhe të shumta duke përdorur nxitjen e “zinxhirit të mendimit” me disa shkrepje, një teknikë që lejon AI të kryejë zgjidhje komplekse dhe të hapura të problemeve bazuar në shembuj minimalë.

Ky hulumtim del si pjesë e nismës më të gjerë të Apple për të përmirësuar aftësitë e saj të AI në mes të konkurrencës në rritje. Më herët sot, Mark Gurman i Bloomberg raportoi se Apple është në diskutime me Google për të licencuar modelet gjeneruese të Gemini të Google në gjuhë të mëdha për të fuqizuar veçoritë e reja që vijnë në iPhone si pjesë e iOS 18.