Një inteligjencë artificiale e re i kthen fotot në botë 3D të eksplorueshme

foto

Të martën, Tencent publikoi HunyuanWorld-Voyager, një model të ri AI me pesha të hapura që gjeneron sekuenca video konsistente 3D nga një imazh i vetëm, duke u lejuar përdoruesve të pilotojnë një shteg kamere për të “eksploruar” skena virtuale.

foto

Modeli gjeneron njëkohësisht informacion video RGB dhe thellësie për të mundësuar rindërtimin direkt 3D pa pasur nevojë për teknika tradicionale të modelimit.

foto

Megjithatë, nuk do të zëvendësojë lojërat video së shpejti. Rezultatet nuk janë modele të vërteta 3D, por ato arrijnë një efekt të ngjashëm: Mjeti AI gjeneron korniza video 2D që ruajnë qëndrueshmërinë hapësinore sikur një kamera të lëvizte nëpër një hapësirë ​​reale 3D. Çdo brez prodhon vetëm 49 korniza – afërsisht dy sekonda video – megjithëse klipe të shumta mund të lidhen së bashku për sekuenca që zgjasin “disa minuta”, sipas Tencent.

Objektet qëndrojnë në të njëjtat pozicione relative kur kamera lëviz rreth tyre, dhe perspektiva ndryshon saktë siç do të prisnit në një mjedis të vërtetë 3D. Ndërsa rezultati është video me harta thellësie në vend të modeleve të vërteta 3D, ky informacion mund të shndërrohet në re pikash 3D për qëllime rindërtimi.