Sora nga OpenAI krijon video super realistike nga teksti

OpenAI, krijuesi i ChatGPT, ka zbuluar një formë të re të inteligjencës artificiale që krijon video realiste bazuar në kërkesat e tekstit, duke shkaktuar reagime të habitshme në internet.

foto

Modeli tekst-në-video, i quajtur Sora, ka “një kuptim të thellë të gjuhës” dhe mund të gjenerojë “karaktere bindëse që shprehin emocione të gjalla”, tha OpenAI në një postim në blog të enjten.

foto

“Sora është në gjendje të gjenerojë skena komplekse me karaktere të shumta, lloje specifike të lëvizjes dhe detaje të sakta të subjektit dhe sfondit”, tha startup-i i mbështetur nga Microsoft.

“Modeli kupton jo vetëm atë që përdoruesi ka kërkuar në kërkesë, por edhe se si ekzistojnë ato gjëra në botën fizike.”

CEO i OpenAI, Sam Altman në X, i ftoi përdoruesit të sugjeronin kërkesa për Sora përpara se të postonin rezultate që përfshinin video realiste të dy retrieverëve të artë që po bënin podkaste në majë të një mali, një gjyshe që bën njoki dhe kafshë detare që marrin pjesë në një garë biçikletash në majë të oqeanit.

Cilësia hiper-realiste e videove shkaktoi reagime të habitshme në të gjithë mediat sociale, me përdoruesit që i quajtën rezultatet “jashtë kësaj bote” dhe një “ndryshues i lojës”.

“Kanë kaluar dy orë dhe truri im ende nuk mund t’i përpunojë këto video të gjeneruara OpenAI Sora,” tha përdoruesi i X Allen T.

Demonstrata promovoi gjithashtu shqetësime për rreziqet e mundshme, veçanërisht në një vit zgjedhjesh të vëzhguara nga afër në mbarë botën, duke përfshirë zgjedhjet presidenciale të SHBA në nëntor.

OpenAI tha në postimin e saj në blog se do të ndërmerrte disa hapa të rëndësishëm sigurie përpara se të lëshonte Sora për publikun e gjerë.

“Ne po punojmë me ekipe të kuqe – ekspertë të fushës në fusha si keqinformimi, përmbajtja e urrejtjes dhe paragjykimet – të cilët do të testojnë në mënyrë kundërshtare modelin,” tha kompania.

“Ne po ndërtojmë gjithashtu mjete për të ndihmuar në zbulimin e përmbajtjes mashtruese, si p.sh. një klasifikues zbulimi që mund të tregojë kur një video është krijuar nga Sora.”

OpenAI pranoi gjithashtu se Sora ka dobësi, duke përfshirë vështirësinë me vazhdimësinë dhe dallimin e së majtës nga e djathta.

“Për shembull, një person mund të marrë një pickim nga një cookie, por më pas, cookie mund të mos ketë një shenjë pickimi,” tha startup-i me bazë në San Francisko.

Rivalët e OpenAI Meta dhe Google kanë demonstruar gjithashtu teknologjinë e AI-t tekst-në-video, por modelet e tyre nuk kanë prodhuar rezultate aq reale sa ato të Sora.