Google DeepMind zbulon Genie 2, një AI që gjeneron botë 3D të luajtshme

foto

Google DeepMind ka zbuluar Genie 2, një model themelor i AI që transformon imazhet e vetme në mjedise 3D të luajtshme.

Genie 2 krijon botë interaktive 3D nga imazhe të vetme, të luajtshme deri në një minutë.

foto

Modeli demonstron aftësi të avancuara duke përfshirë fizikën, ndriçimin dhe sjelljen NPC.

DeepMind integroi me sukses agjentin e tij SIMA për të operuar brenda botëve të krijuara të Genie 2.

Teknologjia mund të revolucionarizojë trajnimin e AI dhe prototipin e shpejtë të lojërave.

foto

Google DeepMind ka hyrë në një garë gjithnjë e më konkurruese për ndërtimin e botës së AI me Genie 2. Teknologjia shihet si vendimtare për trajnimin e robotëve dhe ndërtimin e sistemeve më të aftë të AI. Në fillim të kësaj jave, ne morëm gjithashtu një vështrim të parë në kompaninë e Fei-Fei Li, World Labs, e cila është duke punuar në një projekt të ngjashëm. Në tetor, startup-i izraelit Decart shfaqi modelin e tyre botëror, Oasis.

Ndryshe nga Decart’s Oasis, i cili lufton me ruajtjen e rezolucionit dhe paraqitjes së nivelit, Genie 2 mund të ruajë qëndrueshmërinë e skenës dhe të kujtojë me saktësi elementët jashtë ekranit. Modeli përputhet me aftësitë e World Labs në kujtesën hapësinore duke shtuar veçori më të sofistikuara ndërveprimi.

Genie 2 krijon mjedise të larmishme dhe të pasura 3D që mund të luhen deri në një minutë. Përdoruesit mund të ndërveprojnë me elementë si personazhet që nuk mund të luhen (NPC), fizika e objekteve dhe efektet komplekse mjedisore si graviteti dhe përplasja.

Genie 2 shkon përtej simulimit vizual, duke demonstruar animacione komplekse të personazheve, ndriçim realist, reflektime dhe madje duke simuluar forcat fizike. Qoftë duke lundruar në rrënojat e lashta apo një papafingo futuristike, Genie 2 shton një nivel të ri realizmi.

Google DeepMind ka integruar Genie 2 me agjentin SIMA, duke e lejuar atë të ndjekë komandat në mjediset e krijuara. SIMA mund të eksplorojë, ndërveprojë dhe kryejë detyra si hapja e dyerve ose lundrimi në terren të gjitha bazuar në kërkesat e gjeneruara nga Genie 2.

Trajnimi i AI është përballur me pengesa për shkak të mungesës së mjediseve të ndryshme dhe të pasura. Google DeepMind e sheh Genie 2 si një mjet themelor për të kapërcyer këto sfida, duke ofruar një shumëllojshmëri të gjerë skenarësh trajnimi për zhvillimin e agjentëve më të përgjithësuar të AI.

Teknologjia pas Genie 2 kombinon të dhëna video në shkallë të gjerë dhe një model të difuzionit latent autoregresiv për të krijuar këto mjedise nga hyrje të thjeshta – si një skenë nga Egjipti i lashtë ose një peizazh fantastiko-shkencor. Ky prototip i shpejtë mund të revolucionarizojë mënyrën se si projektuesit, studiuesit dhe zhvilluesit krijojnë dhe ndërveprojnë me botët virtuale.

Një nga sfidat për agjentët e AI është ruajtja e kujtesës së mjedisit. Genie 2 mund të kujtojë elementët dhe të ruajë pozicionet e tyre edhe kur ata largohen nga shikimi i përdoruesit, duke zgjidhur një problem kyç në konsistencën e hapësirave 3D të krijuara.

Mos u emociononi shumë – Genie 2 nuk do të krijojë ende lojëra video AAA. Google e ka pozicionuar atë si një mjet kërkimi dhe prototipi. Ai lejon krijimin e shpejtë të mjediseve të pasura, duke e bërë më të lehtë vlerësimin e AI në situata për të cilat nuk janë trajnuar.

Ky nisje përputhet me shtytjen më të gjerë të Google drejt AI gjeneruese dhe teknologjive zhytëse, duke synuar të mjegullojë linjat midis botës dixhitale dhe asaj fizike.

Përparimet e ardhshme në Genie mund të çojnë në agjentë të AI të aftë në trajtimin e sfidave të botës reale me sofistikim të paparë.

Genie 2 i Google është një hap i madh drejt bërjes së botëve virtuale jo vetëm zhytëse, por ndërvepruese dhe të dobishme si për trajnimin e AI, ashtu edhe për prototipimin e përvojave krijuese. Është një hap emocionues drejt integrimit të imagjinatës në realitetin tonë – dhe një hap që mund të riformësojë mënyrën se si ndërveprojmë si me AI ashtu edhe me hapësirat virtuale që ata banojnë.