Studiuesi kryesor i AI i Meta thotë se imituesi botëror i OpenAI-t Sora është një rrugë pa krye

Por sipas Yann LeCun, kreut të departamentit të AI të Metës, Sora nuk është e përshtatshme për këtë. Studiuesi i njohur i AI ka fjalë të ashpra për teorinë e simulatorit të OpenAI. Modelimi i botës për veprim duke gjeneruar pikselë është po aq i kotë dhe i dënuar me dështim.

foto

Ka pasur një debat historik rreth meritave të metodave të klasifikimit gjenerues kundrejt diskriminimit, me metoda gjeneruese të konsideruara më të vështira dhe më pak efektive, tha LeCun.

foto

LeCun beson se modelet gjeneruese për inputet ndijore do të dështojnë sepse është shumë e vështirë të merret me pasigurinë e parashikimit të inputeve të vazhdueshme ndijore me dimensione të larta.

Për tekstin, AI gjeneruese funksionon mirë sepse teksti është diskret dhe ka një numër të kufizuar simbolesh. Përballja me pasigurinë është e lehtë këtu. Megjithatë, inputet ndijore gjenerojnë një nivel më të lartë kompleksiteti.

“Nëse qëllimi juaj është të trajnoni një model botëror për njohje ose planifikim, përdorimi i parashikimit të nivelit të pikselit është një ide e tmerrshme,” shkruan LeCun.

Pothuajse në të njëjtën kohë me Sora, LeCun prezantoi një model të ri me arkitekturën e tij, Video Joint Embedding Predictive Architecture (V-JEPA), si një hap drejt një modeli botëror që nuk mbështetet në metodat gjeneruese.

Modeli parashikon ndërveprime komplekse dhe i interpreton ato duke shtuar pjesë të fshehura të videove për të përcjellë dinamikën e objekteve dhe ndërveprimet në AI.

V-JEPA fokusohet në parashikimet në një hapësirë ​​më të gjerë konceptuale, të ngjashme me përpunimin kognitiv të imazhit të njeriut.

Kjo arkitekturë lejon V-JEPA të përshtatet me detyra të ndryshme duke shtuar një shtresë të vogël, specifike për detyrën në vend që të ritrajnojë të gjithë modelin – një përparim i madh mbi modelet tradicionale të AI.

Ekipi i AI i Meta planifikon të zgjerojë aftësitë e V-JEPA dhe të përmirësojë parashikimet afatgjata, duke zhvilluar përfundimisht modele gjithëpërfshirëse botërore për sistemet autonome të AI.