Modeli i ri i inteligjencës artificiale të Microsoft-it krijon video hiper-realiste duke përdorur imazhe statike
Microsoft ka lançuar VASA-1, një model të avancuar të inteligjencës artificiale (AI) i aftë për të gjeneruar video hiper-realiste të fytyrave njerëzore që flasin duke përdorur vetëm një foto të vetme dhe një klip audio.
Dalja që rezulton shfaq lëvizjet e sinkronizuara të buzëve që përputhen me audion, të plotësuara nga shprehjet e fytyrës me pamje natyrale dhe lëvizjet e kokës.
Pavarësisht aplikimeve të tij të mundshme, Microsoft sqaroi se nuk ka në plan të lëshojë një produkt ose API me modelin VASA-1, por do ta përdorë atë për krijimin e karaktereve virtuale interaktive.
VASA-1 i Microsoft, ende në zhvillim e sipër, është në gjendje të gjenerojë video me rezolucion 512x512p deri në 40fps me vonesë minimale fillestare.
Gjigandi i teknologjisë i ndau këto njohuri në faqen e tij të njoftimit të kërkimit.
Një video që demonstron modelin e AI u shpërnda nga përdoruesi i X Kaio Ken.
Shërbimi imazh-në-video mund të prodhojë video me cilësi të lartë deri në një minutë të gjatë nga një imazh i vetëm statik.
VASA-1 u ofron përdoruesve kontroll të hollësishëm mbi aspekte të ndryshme të videos, duke përfshirë drejtimin kryesor të shikimit të syrit, zhvendosjet e emocioneve, distancën e kokës dhe më shumë.
Këto kontrolle lejojnë modifikimin e daljes afërsisht sipas drejtimeve të tyre.
Është interesante se ky model i AI mund të gjenerojë gjithashtu video duke përdorur audio këndimi, foto artistike dhe fjalim jo-anglisht.
Studiuesit e Microsoft vunë re se këto funksione nuk ishin të pranishme në të dhënat e tij fillimisht, duke treguar një aftësi të vetë-mësimit brenda modelit.
Pavarësisht aftësive mbresëlënëse të VASA-1, janë ngritur shqetësime rreth keqpërdorimeve të mundshme, të tilla si krijimi i falsifikimit të thellë.
Microsoft ka siguruar se nuk ka ndërmend të lëshojë modelin e AI për publikun dhe planifikon ta përdorë atë për krijimin e karaktereve virtuale interaktive.
Kompania gjithashtu theksoi potencialin e kësaj teknike në avancimin e zbulimit të falsifikimit.