Modeli i ri i inteligjencës artificiale të Microsoft-it krijon video hiper-realiste duke përdorur imazhe statike

Microsoft ka lançuar VASA-1, një model të avancuar të inteligjencës artificiale (AI) i aftë për të gjeneruar video hiper-realiste të fytyrave njerëzore që flasin duke përdorur vetëm një foto të vetme dhe një klip audio.

Dalja që rezulton shfaq lëvizjet e sinkronizuara të buzëve që përputhen me audion, të plotësuara nga shprehjet e fytyrës me pamje natyrale dhe lëvizjet e kokës.

Pavarësisht aplikimeve të tij të mundshme, Microsoft sqaroi se nuk ka në plan të lëshojë një produkt ose API me modelin VASA-1, por do ta përdorë atë për krijimin e karaktereve virtuale interaktive.

VASA-1 i Microsoft, ende në zhvillim e sipër, është në gjendje të gjenerojë video me rezolucion 512x512p deri në 40fps me vonesë minimale fillestare.

Gjigandi i teknologjisë i ndau këto njohuri në faqen e tij të njoftimit të kërkimit.

Një video që demonstron modelin e AI u shpërnda nga përdoruesi i X Kaio Ken.

Shërbimi imazh-në-video mund të prodhojë video me cilësi të lartë deri në një minutë të gjatë nga një imazh i vetëm statik.

a single 4090
that's insane https://t.co/A73HrMewyP pic.twitter.com/fHjb2y1hQD
— Kaio Ken (@kaiokendev1) April 17, 2024

VASA-1 u ofron përdoruesve kontroll të hollësishëm mbi aspekte të ndryshme të videos, duke përfshirë drejtimin kryesor të shikimit të syrit, zhvendosjet e emocioneve, distancën e kokës dhe më shumë.

Këto kontrolle lejojnë modifikimin e daljes afërsisht sipas drejtimeve të tyre.

Është interesante se ky model i AI mund të gjenerojë gjithashtu video duke përdorur audio këndimi, foto artistike dhe fjalim jo-anglisht.

Studiuesit e Microsoft vunë re se këto funksione nuk ishin të pranishme në të dhënat e tij fillimisht, duke treguar një aftësi të vetë-mësimit brenda modelit.

Pavarësisht aftësive mbresëlënëse të VASA-1, janë ngritur shqetësime rreth keqpërdorimeve të mundshme, të tilla si krijimi i falsifikimit të thellë.

Microsoft ka siguruar se nuk ka ndërmend të lëshojë modelin e AI për publikun dhe planifikon ta përdorë atë për krijimin e karaktereve virtuale interaktive.

Kompania gjithashtu theksoi potencialin e kësaj teknike në avancimin e zbulimit të falsifikimit.

Tags: AI, API, Artificial Intelligjence, Computer, Kaio Ken, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, microsoft, Twitter, VASA-1, X

Modeli i ri i inteligjencës artificiale të Microsoft-it krijon video hiper-realiste duke përdorur imazhe statike

Apple dhe Lenovo kanë laptopët më pak të riparueshëm

LinkedIn skanon fshehurazi mbi 6000 shtesa të shfletuesit

“Microsoft Copilot është vetëm për qëllime argëtimi”: Edhe kushtet dhe termat zyrtare të Microsoft thonë se në të vërtetë nuk duhet ta përdorni AI-në e saj në punë

Meta zgjeron marrëveshjen e saj për cloud-in e AI me CoreWeave në 21 miliardë dollarë

OpenAI pezullon Stargate UK për shkak të kostove të energjisë

Anthropic humb përpjekjen në gjykatën e apelit për të bllokuar përkohësisht listën e zezë nga Pentagoni

Meta heq reklamat që lidhen me paditë për varësinë nga rrjetet sociale

Tesla po zhvillon një makinë elektrike të re më të vogël dhe më të lirë

Andy Jassy mbron shpenzimet masive prej 200 miliardë dollarësh të Amazon-it

You may have missed