Runway zbulon modelin e parë “General World Model”, së bashku me përmirësime të mëdha të Gen-4.5

foto

Runway ka përmirësuar Gen-4.5 dhe ka prezantuar GWM-1, “Modelin e Përgjithshëm të Botës” të parë të kompanisë.

foto

Versioni Gen-4.5 i prezantuar së fundmi tani ofron gjenerim dhe redaktim audio nativ, si dhe redaktim me shumë pamje, një veçori që u lejon përdoruesve të aplikojnë ndryshime në një skenë të vetme dhe t’i bëjnë ato të përhapen në të gjithë videon.

foto

GWM-1 i ri ndërton një përfaqësim të brendshëm të një mjedisi për të simuluar ngjarjet e ardhshme në kohë reale. I ndërtuar mbi arkitekturën Gen-4.5, ai gjeneron video kornizë pas kuadri, duke lejuar njëkohësisht kontroll interaktiv përmes inputeve si lëvizjet e kamerës, komandat e robotit ose audio.

Modeli i botës vjen në tre versione të dallueshme: GWM Worlds për krijimin e mjediseve të eksplorueshme, GWM Avatars për gjenerimin e personazheve që flasin me shprehje realiste të fytyrës dhe sinkronizim të buzëve, dhe GWM Robotics për prodhimin e të dhënave sintetike të trajnimit për robotët. Runway planifikon që përfundimisht t’i bashkojë këto aftësi në një model të vetëm të unifikuar.

Runway nuk është e vetmja që po ndjek këtë teknologji. Fusha po bëhet e mbushur me njerëz.

Laboratorë të tjerë, përfshirë Google DeepMind dhe një startup të ri nga studiuesi i inteligjencës artificiale Yann LeCun , po zhvillojnë gjithashtu modele botërore. Industria i sheh këto sisteme si një evolucion kritik përtej modeleve konvencionale gjuhësore, të cilave ende u mungon një kuptim themelor i botës fizike. Drejtori ekzekutiv i Google DeepMind, Demis Hassabis, konfirmoi se ndërtimi i këtyre modeleve është qendror në strategjinë e kompanisë për arritjen e Inteligjencës së Përgjithshme Artificiale (IAG).

Gara përfshin gjithashtu World Labs, një startup i themeluar nga Fei-Fei Li që mblodhi 230 milionë dollarë për të zhvilluar “Modele të Mëdha të Botës” (LWM) me inteligjencë hapësinore. Kompania kohët e fundit zbuloi “Marble”, një prototip të aftë për të renderuar mjedise të vazhdueshme 3D nga kërkesa multimodale. Startup-i Spaitial me bazë në Mynih po zhvillon Modele të Fondacionit Hapësinor të dizajnuara për të gjeneruar dhe interpretuar botë 3D me dinamikë fizike të qëndrueshme.

Konkurrenca vazhdon të zgjerohet. Startup-et Etched dhe Decart prezantuan së fundmi projektin “Oasis”, një sistem që gjeneron botë 3D të luajtshme në stilin Minecraft në kohë reale me 20 korniza për sekondë. Ndërsa lejon ndërveprime themelore si kërcimi dhe marrja e objekteve, ai ende përballet me sfida të qëndrueshmërisë – lojtarët ndonjëherë e gjejnë veten në mjedise të ndryshme thjesht duke u kthyer.

Në gusht, gjigandi kinez i teknologjisë Tencent lançoi Hunyuan World Model 1.0, një model gjenerues i inteligjencës artificiale me burim të hapur që krijon skena virtuale 3D nga teksti ose imazhet.