Modeli i ri i inteligjencës artificiale të Microsoft-it krijon video hiper-realiste duke përdorur imazhe statike

foto

Microsoft ka lançuar VASA-1, një model të avancuar të inteligjencës artificiale (AI) i aftë për të gjeneruar video hiper-realiste të fytyrave njerëzore që flasin duke përdorur vetëm një foto të vetme dhe një klip audio.

foto

Dalja që rezulton shfaq lëvizjet e sinkronizuara të buzëve që përputhen me audion, të plotësuara nga shprehjet e fytyrës me pamje natyrale dhe lëvizjet e kokës.

foto

Pavarësisht aplikimeve të tij të mundshme, Microsoft sqaroi se nuk ka në plan të lëshojë një produkt ose API me modelin VASA-1, por do ta përdorë atë për krijimin e karaktereve virtuale interaktive.

VASA-1 i Microsoft, ende në zhvillim e sipër, është në gjendje të gjenerojë video me rezolucion 512x512p deri në 40fps me vonesë minimale fillestare.

Gjigandi i teknologjisë i ndau këto njohuri në faqen e tij të njoftimit të kërkimit.

Një video që demonstron modelin e AI u shpërnda nga përdoruesi i X Kaio Ken.

Shërbimi imazh-në-video mund të prodhojë video me cilësi të lartë deri në një minutë të gjatë nga një imazh i vetëm statik.

VASA-1 u ofron përdoruesve kontroll të hollësishëm mbi aspekte të ndryshme të videos, duke përfshirë drejtimin kryesor të shikimit të syrit, zhvendosjet e emocioneve, distancën e kokës dhe më shumë.

Këto kontrolle lejojnë modifikimin e daljes afërsisht sipas drejtimeve të tyre.

Është interesante se ky model i AI mund të gjenerojë gjithashtu video duke përdorur audio këndimi, foto artistike dhe fjalim jo-anglisht.

Studiuesit e Microsoft vunë re se këto funksione nuk ishin të pranishme në të dhënat e tij fillimisht, duke treguar një aftësi të vetë-mësimit brenda modelit.

Pavarësisht aftësive mbresëlënëse të VASA-1, janë ngritur shqetësime rreth keqpërdorimeve të mundshme, të tilla si krijimi i falsifikimit të thellë.

Microsoft ka siguruar se nuk ka ndërmend të lëshojë modelin e AI për publikun dhe planifikon ta përdorë atë për krijimin e karaktereve virtuale interaktive.

Kompania gjithashtu theksoi potencialin e kësaj teknike në avancimin e zbulimit të falsifikimit.