Shefi i inteligjencës artificiale të Metës thotë se modelet botërore janë kyçe për Inteligjencën Artificiale të nivelit njerëzor – por mund të kalojnë 10 vjet

foto

A kujtojnë, mendojnë, planifikojnë dhe arsyetojnë vërtet modelet e sotme të AI-së, ashtu si truri i njeriut? Disa laboratorë të AI do të donin që të besoni se janë, por sipas shefit të shkencëtarit të AI të Meta, Yann LeCun, përgjigjja është jo. Ai mendon se ne mund të arrijmë atje brenda një dekade apo më shumë, megjithatë, duke ndjekur një metodë të re të quajtur “modeli botëror”.

foto

Në fillim të këtij viti, OpenAI lëshoi ​​​​një veçori të re që e quan ” memorie ” që lejon ChatGPT të “kujtojë” bisedat tuaja. Gjenerata e fundit e modeleve të startup-it, o1, shfaq fjalën “të menduarit” ndërsa gjeneron një rezultat, dhe OpenAI thotë se të njëjtat modele janë të afta për “arsyetim kompleks”.

foto

E gjithë kjo duket sikur jemi shumë afër inteligjencës së përgjithshme artificiale (AGI). Megjithatë, gjatë një bisede të fundit në Forumin Hudson, LeCun nënvlerësoi optimistët e AI, si themeluesi i xAI, Elon Musk dhe bashkëthemeluesi i Google DeepMind, Shane Legg, të cilët sugjerojnë se AI në nivel njerëzor është afër qoshes.

“Ne kemi nevojë për makina që kuptojnë botën; [makinat] që mund të mbajnë mend gjërat, që kanë intuitë, kanë sens të përbashkët, gjëra që mund të arsyetojnë dhe planifikojnë në të njëjtin nivel si njerëzit, “tha LeCun gjatë bisedës. “Pavarësisht asaj që mund të keni dëgjuar nga disa prej njerëzve më entuziastë, sistemet aktuale të AI nuk janë të afta për asnjë nga këto.”

LeCun thotë se modelet e sotme të gjuhëve të mëdha (LLM), si ato që fuqizojnë ChatGPT dhe Meta AI, janë larg nga “AI i nivelit njerëzor”. Njerëzimi mund të jetë “vite në dekada” larg arritjes së një gjëje të tillë, tha ai më vonë. (Kjo nuk e pengon shefin e tij, Mark Zuckerberg, që ta pyesë se kur do të ndodhë AGI.)

Arsyeja pse është e drejtpërdrejtë: ato LLM punojnë duke parashikuar shenjën tjetër (zakonisht disa shkronja ose një fjalë të shkurtër), dhe modelet e sotme të imazhit/video po parashikojnë pikselin e ardhshëm. Me fjalë të tjera, modelet e gjuhës janë parashikues njëdimensionale dhe modelet e imazhit/videos të AI janë parashikues dydimensionale. Këto modele janë bërë mjaft të mira në parashikimin në dimensionet e tyre përkatëse, por nuk e kuptojnë vërtet botën tredimensionale.

Për shkak të kësaj, sistemet moderne të AI nuk mund të bëjnë detyra të thjeshta që munden shumica e njerëzve. LeCun vëren se si njerëzit mësojnë të pastrojnë tryezën e darkës në moshën 10 vjeç dhe të ngasin një makinë në moshën 17-vjeçare – dhe i mësojnë të dyja brenda disa orësh. Por edhe sistemet më të avancuara të AI sot në botë, të ndërtuara mbi mijëra ose miliona orë të dhënash, nuk mund të funksionojnë me besueshmëri në botën fizike.

Për të arritur detyra më komplekse, LeCun sugjeron që ne duhet të ndërtojmë modele tredimensionale që mund të perceptojnë botën përreth jush dhe të përqendrohen rreth një lloji të ri të arkitekturës së AI: modelet botërore.

“Një model botëror është modeli juaj mendor se si sillet bota,” shpjegoi ai. “Ju mund të imagjinoni një sekuencë veprimesh që mund të bëni dhe modeli juaj i botës do t’ju lejojë të parashikoni se cili do të jetë efekti i sekuencës së veprimeve në botë.”

Konsideroni “modelin botëror” në kokën tuaj. Për shembull, imagjinoni të shikoni një dhomë gjumi të çrregullt dhe të dëshironi ta bëni atë të pastër. Ju mund të imagjinoni se si do të ishte e dobishme të merrni të gjitha rrobat dhe t’i vendosnin ato. Ju nuk keni nevojë të provoni metoda të shumta, ose të mësoni se si të pastroni një dhomë në fillim. Truri juaj vëzhgon hapësirën tredimensionale dhe krijon një plan veprimi për të arritur qëllimin tuaj në përpjekjen e parë. Ky plan veprimi është salca sekrete që premtojnë modelet botërore të AI.

Një pjesë e përfitimit këtu është se modelet botërore mund të marrin dukshëm më shumë të dhëna sesa LLM-të. Kjo gjithashtu i bën ata intensivisht llogaritës, prandaj ofruesit e reve kompjuterike po garojnë për të bashkëpunuar me kompanitë e AI.

Modelet botërore janë ideja e madhe që tani po ndjekin disa laboratorë të AI dhe termi po bëhet shpejt kryefjala e radhës për të tërhequr financime sipërmarrëse. Një grup studiuesish shumë të vlerësuar të AI, përfshirë Fei-Fei Li dhe Justin Johnson, sapo mblodhën 230 milionë dollarë për startup-in e tyre, World Labs. “Kumbara e AI” dhe ekipi i saj është gjithashtu i bindur se modelet botërore do të zhbllokojnë sisteme dukshëm më të zgjuara të AI. OpenAI e përshkruan gjithashtu gjeneratorin e tij të papublikuar të videove Sora si një model botëror, por nuk ka hyrë në specifika.

Në një punim të vitit 2022 mbi “Inteligjencën Artificiale të drejtuar nga objektivat”, LeCun përshkroi një ide për përdorimin e modeleve botërore për të krijuar AI në nivel njerëzor, megjithëse ai vëren se koncepti është mbi 60 vjeç. Me pak fjalë, një përfaqësim bazë i botës (siç është video e një dhome të pistë) dhe kujtesa futen në një model botëror. Pastaj modeli botëror parashikon se si do të duket bota bazuar në atë informacion. Pastaj ju i jepni objektivave të modelit botëror, duke përfshirë një gjendje të ndryshuar të botës që dëshironi të arrini (si p.sh. një dhomë e pastër) dhe parmakë për të siguruar që modeli të mos dëmtojë njerëzit për të arritur një objektiv (mos më vrisni në procesi i pastrimit të dhomës sime, ju lutem). Pastaj modeli botëror gjen një sekuencë veprimi për të arritur këto objektiva.

Sipas LeCun, laboratori i kërkimit afatgjatë të AI të Meta-s, FAIR (Fundamental AI Research), po punon në mënyrë aktive drejt ndërtimit të AI dhe modeleve botërore të drejtuara nga objektivat. FAIR punonte në AI për produktet e ardhshme të Meta-s, por LeCun thotë se laboratori është zhvendosur vitet e fundit në fokusimin thjesht në kërkimin afatgjatë të AI. LeCun thotë se FAIR nuk përdor as LLM këto ditë.

Modelet botërore janë një ide intriguese, por LeCun thotë se ne nuk kemi bërë shumë përparim në sjelljen e këtyre sistemeve në realitet. Ka shumë probleme shumë të vështira për të arritur nga këtu ku jemi sot, dhe ai thotë se është sigurisht më e ndërlikuar nga sa mendojmë.

“Do të duhen vite përpara se të arrijmë gjithçka këtu të funksionojë, nëse jo një dekadë,” tha LeCun. “Mark Zuckerberg vazhdon të më pyesë se sa kohë do të zgjasë.”