Modeli i ri i videove Runway Gen-4.5 me AI rrëzon nga froni Google Veo 3 dhe OpenAI Sora 2

foto

Runway ka publikuar Gen-4.5, një model të ri videoje me inteligjencë artificiale që ka zënë vendin e parë në testet e pavarura, duke tejkaluar Veo 3 të Google dhe Sora 2 Pro të OpenAI.

foto

Duke pretenduar një fitore vendimtare ndaj operatorëve ekzistues me vlerë trilion dollarë, Runway ka lançuar Gen-4.5, një model të ri gjenerimi videosh që siguron vendin e parë në renditjen e Video Arena, një platformë e pavarur për vlerësimin e videove.

foto

Duke arritur një rezultat Elo prej 1,247, sistemi zëvendëson Veo 3 të Google dhe e shtyn Sora 2 Pro të OpenAI në vendin e shtatë. Përfundimi bazohet në arkitekturën e re Blackwell të NVIDIA-s, duke shënuar një vendosje të rrallë në prodhim të çipave të nivelit të lartë.

Duke e paraqitur publikimin si një justifikim të strategjisë së saj të pavarur, ky publikim vjen pas refuzimit të Runway për një ofertë blerjeje nga Meta në fillim të këtij viti.

Duke sfiduar besimin konvencional se shkalla është e barabartë me supremacinë, Runway i ka tejkaluar rivalët e saj më të mëdhenj në një krahasim të drejtpërdrejtë kokë më kokë. I quajtur Gen-4.5, modeli i ri i startup-it ka zënë pozicionin #1 në renditjen e Artificial Analysis Video Arena, një metrikë e nxjerrë nga testimi i verbër A/B ku vlerësuesit njerëzorë krahasojnë rezultatet pa e ditur modelin burimor.

Sigurimi i vendit të parë është veçanërisht i rëndësishëm sepse standardi mbështetet në “ndjeshmëri të shpejtë” dhe “cilësi lëvizjeje” në vend të vetëm rezolucionit ose shpejtësisë së kuadrove. Duke u përqendruar në këto metrika cilësore, Runway ka arritur të zhvendosë Veo 3 të Google, i cili tani renditet në vendin e dytë, dhe ta zbresë Sora 2 Pro të OpenAI në vendin e shtatë.

Këto rezultate nxjerrin në pah cenueshmërinë e laboratorëve të inteligjencës artificiale gjeneraliste ndaj startup-eve të specializuara dhe të fokusuara në vertikale. Ndërsa gjigantë si Google dhe OpenAI i shpërndajnë burimet e tyre në kërkimin e tekstit, kodit dhe multimodal, Runway është përqendruar ekskluzivisht në dinamikën e videos.

Duke shpjeguar efikasitetin e kësaj qasjeje të fokusuar, CEO i Runway, Cristóbal Valenzuela, vuri në dukje se “ne arritëm të tejkalonim kompanitë me vlerë trilion dollarë me një ekip prej 100 personash. Mund të arrish kufij vetëm duke qenë jashtëzakonisht i fokusuar dhe i zellshëm.”

Një hendek i kësaj madhësie sugjeron që ekipet më të vogla dhe të shkathëta mund të konkurrojnë ende në mënyrë efektive kundër departamenteve masive të korporatave të Kërkimit dhe Zhvillimit duke ruajtur një fokus të ngushtë në produkt.

Duke shënuar një ndryshim të rëndësishëm në peizazhin konkurrues, modeli shkon përtej “gjenerimit të thjeshtë të videos” në atë që kompania e përshkruan si “modele botërore” që e kuptojnë fizikën. Zhvillimi u krye tërësisht në infrastrukturën e NVIDIA-s, duke përfshirë kërkimin dhe zhvillimin deri te nxjerrja e përfundimeve.

Çështja thelbësore është se inferenca është optimizuar në mënyrë eksplicite për arkitekturën e re Blackwell të NVIDIA-s, së bashku me GPU-të ekzistuese Hopper. Dhënia përparësi e arkitekturës specifike sugjeron që Runway po përqendrohet në efikasitetin e inferencës për të menaxhuar kostot e larta të gjenerimit të videos në shkallë të gjerë.

Duke theksuar hapin teknik në simulimin fizik, njoftimi zyrtar detajon aftësitë e reja të modelit:

“Gen-4.5 arrin saktësi fizike dhe precizion vizual të paparë. Objektet lëvizin me peshë, vrull dhe forcë realiste. Lëngjet rrjedhin me dinamikën e duhur. Detajet sipërfaqësore paraqiten me besnikëri të madhe.”

Përmirësime specifike të simulimit përfshijnë dinamikën realiste të lëngjeve, peshën e objektit dhe ruajtjen e momentit. Detajet dhe teksturat e sipërfaqes tani ruajnë koherencën edhe gjatë lëvizjeve të shpejta të kamerës ose deformimeve të objekteve, duke adresuar një pikë të zakonshme dështimi në videon gjeneruese.

Duke vërtetuar partneritetin teknik, CEO i NVIDIA, Jensen Huang, deklaroi se ishte “krenar që Runway ndërtoi modelin e saj inovativ të videos dhe botës në GPU-të NVIDIA dhe është i emocionuar që e sheh Runway të revolucionarizojë industrinë e gjenerimit të videos”.

Duke u vendosur në Blackwell, Runway bëhet një nga kompanitë e para që shfrytëzon optimizimet specifike të arkitekturës për inferencë gjeneruese, duke i dhënë potencialisht një avantazh kosto-performancë ndaj konkurrentëve që ende mbështeten në harduer më të vjetër.

1 dhjetori 2025 është shfaqur si një “Super e diel” e rëndësishme për industrinë e videove të inteligjencës artificiale me tre publikime të mëdha njëkohësisht. Ndërsa Runway synon tregun e pronësor të nivelit të lartë, gjigantët kinezë të teknologjisë lançuan sfidues agresivë me burim të hapur në të njëjtën ditë.

ByteDance publikoi Vidi2 të ByteDance , një model me 12 miliardë parametra të fokusuar në “Tokëzimin Hapësinor-Kohor”. Ndryshe nga gjeneratorët e pastër, arkitektura e Vidi2 i jep përparësi redaktimit dhe kuptimit, duke identifikuar se ku ndodhen objektet në kohë dhe hapësirë ​​për të mundësuar manipulim të saktë.

Njëkohësisht, Tencent lançoi HunyuanVideo-1.5 të Tencent, një model me 8.3 miliardë parametra. Strategjia e Tencent synon harduerin e konsumatorit, me modelin e optimizuar për t’u përdorur në GPU me vetëm 14 GB VRAM, duke ofruar në mënyrë efektive gjenerim me cilësi të lartë për entuziastët.

Ekziston një kontrast i qartë midis qasjeve. Runway ofron një produkt SaaS të mbyllur dhe me performancë të lartë, ndërsa firmat kineze po e demokratizojnë teknologjinë nëpërmjet burimit të hapur. Një divergjencë e tillë krijon një treg të dyfishtë ku përdoruesit e ndërmarrjeve mund të paguajnë për besnikërinë e Runway, ndërsa krijuesit individualë dynden drejt alternativave falas dhe të ekzekutueshme në nivel lokal.

Publikimi i sotëm shërben si një justifikim strategjik pas refuzimit nga Runway të një oferte të dështuar blerjeje nga Meta në fillim të vitit 2025. Meta, duke kërkuar të forconte aftësitë e veta të videos, ishte përpjekur ta blinte startup-in për të mbushur boshllëqet në platformën e saj gjeneruese të medias.

Në vend që të shiste, Runway dyfishoi përpjekjet për të ndërtuar një ekosistem gjithëpërfshirës. Funksionalisht, modeli i ri lidhet me redaktorin e videove Aleph të lëshuar në korrik, duke krijuar një rrjedhë pune që pasqyron qasjen e Adobe, por me mjete të inteligjencës artificiale vendase: kapje me Gen-4.5 dhe përsosje me Aleph.

Duke reflektuar mbi vendimin për të mbetur i pavarur, Valenzuela theksoi se “ndihet si një moment shumë interesant në kohë ku epoka e efikasitetit dhe kërkimit është mbi ne. [Jemi] të emocionuar që mund të sigurohemi që IA nuk monopolizohet nga dy ose tre kompani.”

Çmimet për Gen-4.5 përshkruhen si “të krahasueshme” me nivelet e mëparshme, duke treguar një lëvizje agresive për të ruajtur pjesën e tregut kundrejt rivalëve të tregtuar. Duke u bazuar në themelet e hedhura nga Gen-4 i Runway , i cili prezantoi kontrollet kinematografike në fillim të këtij viti, kjo strategji e çimenton më tej pozicionin e kompanisë si një mjet premium për krijuesit profesionistë.