Studiuesit e Apple zbulojnë ‘Keyframer’, një mjet i ri i AI

Studiuesit e Apple kanë zbuluar një mjet të ri të AI të quajtur ” Keyframer “, i cili shfrytëzon fuqinë e modeleve të mëdha gjuhësore (LLM) për të animuar imazhe statike përmes kërkesave të gjuhës natyrore.

foto

Ky aplikacion i ri, i detajuar në një punim të ri kërkimor të botuar në arxiv.org, përfaqëson një hap gjigant në integrimin e inteligjencës artificiale në procesin krijues – dhe gjithashtu mund të lë të kuptohet se çfarë do të vijë në gjeneratat e reja të produkteve të Apple si iPad. Pro dhe Vision Pro.

Punimi kërkimor, i titulluar ” Keyframer: Fuqizimi i Dizajnit të Animacionit duke përdorur Modele të Mëdha Gjuhëshe “, eksploron territorin e paeksploruar në aplikimin e LLM-ve në industrinë e animacionit, duke paraqitur sfida unike të tilla si përshkrimi efektiv i lëvizjes në gjuhën natyrore.

Imagjinoni këtë: Ju jeni një animator me një ide që dëshironi të eksploroni. Ju keni imazhe statike dhe një histori për të treguar, por mendimi i orëve të panumërta duke u përkulur mbi një iPad për t’i dhënë jetë krijimeve tuaja është, mirë, rraskapitës. Futni Keyframer. Me vetëm disa fjali, ato imazhe mund të fillojnë të kërcejnë nëpër ekran, sikur të kenë lexuar mendjen. Ose më mirë, sikur modelet e mëdha gjuhësore të Apple (LLM) të kenë.

foto

Keyframer mundësohet nga një model i madh gjuhësor (në studim, ata përdorin GPT-4 ) që mund të gjenerojë kodin e animacionit CSS nga një imazh statik SVG dhe një kërkesë. “Modelet e mëdha gjuhësore kanë potencialin të ndikojnë në një gamë të gjerë fushash krijuese, por aplikimi i LLM-ve në animacion është i paeksploruar dhe paraqet sfida të reja, të tilla si mënyra se si përdoruesit mund të përshkruajnë në mënyrë efektive lëvizjen në gjuhën natyrore,” shpjegojnë studiuesit.

Për të krijuar një animacion, një përdorues ngarkon një imazh SVG, shkruan një kërkesë teksti si “Bëni retë të lëvizin ngadalë majtas” dhe Keyframer do të gjenerojë kodin për të realizuar atë animacion. Përdoruesit më pas mund të rafinojnë animacionin duke redaktuar direkt kodin CSS ose duke shtuar kërkesa të reja në gjuhën natyrore.

Sipas letrës, “Keyframer mbështet eksplorimin dhe përsosjen e animacioneve përmes kombinimit të nxitjes dhe redaktimit të drejtpërdrejtë të prodhimit të krijuar”. Kjo qasje e përqendruar te përdoruesi u informua nga disa intervista me projektues dhe inxhinierë profesionistë të animacionit, të cilët dhanë komente mbi mjetin e kërkimit, të cilët të gjithë theksuan dizajnin përsëritës dhe kreativitetin.

“Mendoj se kjo ishte shumë më e shpejtë se shumë gjëra që kam bërë… Mendoj se për të bërë diçka të tillë më parë do të duheshin vetëm orë të tëra për ta bërë,” tha një pjesëmarrës i studimit i intervistuar për gazetën.

Studiuesit zbuluan se shumica e përdoruesve morën një qasje përsëritëse, “të zbërthyer” për dizajnet e shpejta, duke shtuar kërkesa të reja për të animuar elementë individualë një nga një. Kjo i lejoi ata të përshtatnin qëllimet e tyre gradualisht në përgjigje të rezultateve të AI.

“Keyframer u mundësoi përdoruesve të përsosin vazhdimisht modelet e tyre përmes nxitjeve të njëpasnjëshme, në vend që të kenë parasysh të gjithë dizajnin e tyre përpara,” shpjegojnë studiuesit në letër. Veçoritë e redaktimit të drejtpërdrejtë të kodit gjithashtu mundësonin kontrollin e grimcuar krijues.

Ndërsa mjetet e animacionit të AI kanë potencialin për të demokratizuar dizajnin, studiuesit pranojnë shqetësimet për humbjen e kontrollit krijues dhe kënaqësisë. Por duke kombinuar nxitjen me redaktimin, Keyframer synon të sigurojë prototipe të aksesueshme duke ruajtur agjencinë e përdoruesit.

“Përmes kësaj pune, ne shpresojmë të frymëzojmë mjetet e ardhshme të dizajnit të animacionit që kombinojnë aftësitë e fuqishme gjeneruese të LLM-ve për të përshpejtuar prototipin e dizajnit me redaktues dinamikë që u mundësojnë krijuesve të mbajnë kontrollin krijues,” përfundojnë studiuesit.

Keyframer premton të transformojë peizazhin e animacionit, duke e bërë atë më të aksesueshëm për një spektër të gjerë krijuesish. Në atë që shihet si një nivelim domethënës i fushës së lojës, Keyframer u ofron jo-ekspertëve aftësinë për të sjellë histori në jetë përmes animacionit – një detyrë që dikur kërkonte aftësi dhe burime të konsiderueshme teknike. Është një dëshmi e rolit në rritje të AI si një forcë bashkëpunuese në procesin krijues, duke sugjeruar një ndryshim në mënyrën se si teknologjia përdoret në sektorë të ndryshëm.

Implikimet e Keyframer shtrihen në një ndryshim kulturor të parashikuar, ku AI bëhet një pjesë më intuitive dhe integrale e përvojës krijuese njerëzore. Nuk është thjesht një kërcim teknologjik, por një katalizator potencial për riimagjinimin e strukturës së ndërveprimit tonë me sferën dixhitale. Lëvizja e Apple me Keyframer mund të jetë një pararendës i një epoke të re ku kufijtë midis krijuesit dhe krijimit bëhen gjithnjë e më të rrjedhshëm, të udhëhequr nga dora e padukshme e inteligjencës artificiale.