Sora i OpenAI është mjaft i ngadalshëm për të gjeneruar video

Modeli i ri tekst-në-video i OpenAI, Sora, ka të ngjarë të mbetet në zhvillim për ca kohë përpara një publikimi.

foto

Sipas Bloomberg, OpenAI nuk ka vendosur ende një plan të saktë lëshimi. Ka dy arsye për këtë: Njëra është se OpenAI nuk dëshiron të marrë ndonjë rrezik sigurie, duke pasur parasysh numrin e zgjedhjeve këtë vit. Arsyeja e dytë është se modeli nuk është ende teknikisht gati për dalje.

foto

Kur OpenAI zbuloi Sora, kompania vuri në dukje mangësitë në kuptimin fizik dhe qëndrueshmërinë e modelit. Testet e Bloomberg me dy kërkesa të krijuara nga OpenAI konfirmuan këto çështje. Për shembull, në videon e mëposhtme, papagalli në fund kthehet në majmun.

“Sora mbetet një projekt kërkimor, shumë pak njerëz kanë akses në të dhe kishte kufizime të qarta për mjetin gjatë demonstrimit tonë privat me OpenAI,” shkruan Bloomberg.

Vlen të përmendet se Bloomberg i dha OpenAI katër kërkesa, por OpenAI gjeneroi vetëm dy video. Kompania përmendi kufizimet kohore nga ana e studiuesve të saj. Kjo sugjeron që procesi i gjenerimit është i gjatë dhe/ose i papjekur.

OpenAI nuk ka dhënë asnjë detaj për shpejtësinë e Sorës. Por do të zgjasë më shumë se gjeneratorët standardë të imazhit. Tani për tani, ju mund të merrni “me siguri” një rostiçeri ndërsa prisni videon e përfunduar, thotë studiuesi i OpenAI Bill Peebles. Sigurisht, kjo mund të ndryshojë përpara publikimit.

Peebles gjithashtu pranon gabimet e gjeneratës së Sorës, por ende e quan sistemin një “hap të rëndësishëm” në gjenerimin e videove me AI, veçanërisht për sa i përket kompleksitetit të skenës.

Sora është aktualisht në fazën e ekipit të kuq dhe artistëve, kineastëve dhe stilistëve të përzgjedhur u është dhënë akses në sistem. Kjo u njoftua nga OpenAI kur modeli u zbulua.