Runway publikon modelin e videos Gen-4 me fokus te konsistenca

foto

Runway ka lëshuar Gen-4, modelin e tij më të fundit të AI për gjenerimin e videove. Kompania thotë se sistemi adreson një nga sfidat më të mëdha në gjenerimin e videove me AI: ruajtjen e karaktereve dhe objekteve të qëndrueshme përgjatë skenave.

foto

Sipas Runway, Gen-4 krijon video më dinamike me lëvizje realiste duke i mbajtur të qëndrueshme motivet, objektet dhe stilet në të gjithë kornizat. “Gen-4 vendos një standard të ri për gjenerimin e videove dhe është një përmirësim i dukshëm në krahasim me Gen-3 Alpha,” thotë Runway.

foto

Përparimi kryesor teknik është aftësia e Gen-4 për të mbajtur karaktere të qëndrueshme duke përdorur vetëm një imazh referimi në ndriçim, vendndodhje dhe trajtime të ndryshme. Ai kombinon referencat vizuale me udhëzimet e tekstit për të ruajtur stilet nëpër video.

Sipas Runway, Gen-4 përfaqëson gjithashtu “një moment historik të rëndësishëm në aftësinë e modeleve gjeneruese vizuale për të simuluar fizikën e botës reale”. Sistemi i lejon përdoruesit të vendosin çdo objekt ose subjekt në vende të ndryshme duke ruajtur qëndrueshmërinë.

Runway krijoi disa filma demo për të shfaqur këto aftësi. “Nju Jorku është një kopsht zoologjik” demonstron qëndrueshmërinë e karakterit duke vendosur të njëjtat kafshë në skena të ndryshme të Nju Jorkut, duke kombinuar imazhet referuese të kafshëve me fotografitë e qytetit.

“The Herd” tregon një skenë ndjekjeje nëpër një fushë lope gjatë natës, me Gen-4 që ruan paraqitjet e qëndrueshme të personazheve duke përdorur vetëm disa imazhe referencë.

“The Retrieval”, që tregon eksploruesit duke kërkuar për një lule misterioze, u krijua me Gen-4 në më pak se një javë.

Modeli Gen-4 imazh-në-video është i disponueshëm për abonentët me pagesë dhe klientët e Enterprise. Funksionet e referencës do të shtohen në një përditësim të ardhshëm. Shembuj shtesë janë të disponueshëm në faqen e internetit të RunwayML.

RunwayML është vendosur si një lojtar kryesor në teknologjinë e videove të AI, me një vlerësim prej rreth 4 miliardë dollarësh, të ardhura të raportuara vjetore prej 80 milionë dollarësh në dhjetor 2024 dhe të ardhura vjetore të parashikuara prej 300 milionë dollarësh në 2025. Është konkurrenti më i fortë perëndimor i Sora të OpenAI.