Adobe pretendon se modeli i ri i gjeneratës së imazheve është më i miri deri më tani

foto

Firefly, familja e modeleve gjeneruese të AI të Adobe, nuk ka reputacionin më të mirë mes krijuesve.

Modeli i gjenerimit të imazheve Firefly në veçanti është përqeshur si i dobët dhe me të meta në krahasim me Midjourney, DALL-E 3 të OpenAI dhe rivalë të tjerë, me një tendencë për të shtrembëruar gjymtyrët dhe peizazhet dhe për të humbur nuancat në kërkesat. Por Adobe po përpiqet të korrigjojë anijen me modelin e saj të gjeneratës së tretë, Firefly Image 3, i publikuar këtë javë gjatë konferencës Max London të kompanisë.

Modeli, tani i disponueshëm në Photoshop (beta) dhe aplikacionin ueb të Adobe Firefly, prodhon imazhe më “reale” se paraardhësit e tij ( Imazhi 1 dhe Image 2 ), falë një aftësie për të kuptuar kërkesat dhe skenat më të gjata, më komplekse, si dhe të përmirësuara. ndriçimi dhe aftësitë e gjenerimit të tekstit. Ai duhet të përshkruajë më saktë gjëra si tipografia, ikonografia, imazhet raster dhe arti i linjës, thotë Adobe, dhe është “dukshëm” më i aftë në paraqitjen e turmave të dendura dhe njerëzve me “karakteristika të detajuara” dhe “një shumëllojshmëri humoresh dhe shprehjesh”.

Për atë që ia vlen, në testimin tim të shkurtër joshkencor, Imazhi 3 duket të jetë një hap përpara nga Imazhi 2.

Unë nuk munda ta provoja vetë Image 3. Por Adobe PR dërgoi disa rezultate dhe kërkesa nga modeli, dhe unë arrita të ekzekutoja të njëjtat kërkesa përmes Image 2 në ueb për të marrë mostra për të krahasuar rezultatet e Image 3 me të. (Kini parasysh se rezultatet e Image 3 mund të ishin zgjedhur nga qershia.)

Vini re ndriçimin në këtë fotografi nga Imazhi 3 në krahasim me atë poshtë tij, nga Imazhi 2:

foto
foto

Dalja e Image 3 duket më e detajuar dhe më e gjallë për sytë e mi, me hije dhe kontrast që mungojnë kryesisht në mostrën Image 2.

Këtu është një grup imazhesh që tregojnë kuptimin e skenës së Image 3 në lojë:

foto
foto

Vini re se mostra e Imazhit 2 është mjaft bazë në krahasim me daljen nga Imazhi 3 për sa i përket nivelit të detajeve — dhe ekspresivitetit të përgjithshëm. Ka probleme me subjektin në këmishën e kampionit të Image 3 (rreth zonës së belit), por poza është më komplekse se ajo e subjektit nga Imazhi 2. (Dhe rrobat e Imazhit 2 janë gjithashtu pak të zhveshura.)

Disa nga përmirësimet e Image 3 mund të gjurmohen pa dyshim në një grup të dhënash trajnimi më të madh dhe më të larmishëm.

Ashtu si Image 2 dhe Image 1, Image 3 është trajnuar për ngarkimet në Adobe Stock, biblioteka e mediave pa pagesë të autorit të Adobe, së bashku me përmbajtjen e licencuar dhe të domenit publik, për të cilën e drejta e autorit ka skaduar. Adobe Stock rritet gjatë gjithë kohës, dhe rrjedhimisht, po ashtu, edhe grupi i të dhënave në dispozicion të trajnimit.

Në një përpjekje për të shmangur paditë dhe për të pozicionuar veten si një alternativë më “etike” ndaj shitësve gjenerues të AI që stërviten me imazhe pa dallim (p.sh. OpenAI, Midjourney), Adobe ka një program për të paguar kontribuesit e Adobe Stock në grupin e të dhënave të trajnimit. (Megjithatë, do të vërejmë se kushtet e programit janë mjaft të errëta .) Në mënyrë kontroverse, Adobe trajnon gjithashtu modelet Firefly mbi imazhet e krijuara nga AI, të cilat disa i konsiderojnë si një formë pastrimi të të dhënave.

Raportimi i fundit i Bloomberg zbuloi se imazhet e krijuara nga AI në Adobe Stock nuk përjashtohen nga të dhënat e trajnimit të modeleve që gjenerojnë imazhe Firefly, një perspektivë shqetësuese duke marrë parasysh se ato imazhe mund të përmbajnë materiale të rikthyera me të drejtë autori . Adobe e ka mbrojtur praktikën, duke pretenduar se imazhet e krijuara nga AI përbëjnë vetëm një pjesë të vogël të të dhënave të saj të trajnimit dhe kalojnë përmes një procesi moderim për t’u siguruar që ato të mos përshkruajnë marka tregtare ose personazhe të njohur ose emrat e artistëve të referencës.

Natyrisht, as të dhënat e trajnimit të larmishme, me burime më “etike”, as filtrat e përmbajtjes dhe masat e tjera mbrojtëse nuk garantojnë një përvojë krejtësisht pa të meta – shikoni përdoruesit që gjenerojnë njerëz duke e kthyer zogun me Image 2. Testi i vërtetë i Image 3 do të vijë sapo komuniteti të marrë duart mbi të.

Imazhi 3 fuqizon disa veçori të reja në Photoshop përtej përmirësimit të tekstit në imazh.

Një “motor i stilit” i ri në Image 3, së bashku me një çelës të ri të stilizimit automatik, i lejon modelit të gjenerojë një gamë më të gjerë ngjyrash, sfondesh dhe pozash subjektesh. Ato ushqehen me Reference Image, një opsion që lejon përdoruesit të kushtëzojnë modelin në një imazh, ngjyrat ose tonin e të cilit dëshirojnë që përmbajtja e tyre e gjeneruar në të ardhmen të përafrohet.

Tre mjete të reja gjeneruese — Generate Sfond, Generate Similar dhe Enhance Detail — shfrytëzoni Image 3 për të kryer modifikime të sakta në imazhe. Sfondi Generate (vetë-përshkrues) zëvendëson një sfond me një të krijuar që përzihet në imazhin ekzistues, ndërsa Generate Similar ofron variacione në një pjesë të zgjedhur të një fotografie (p.sh., një person ose një objekt). Sa i përket Përmirësimit të Detajeve, ai “rregullon” imazhet për të përmirësuar mprehtësinë dhe qartësinë.

Nëse këto veçori tingëllojnë të njohura, kjo ndodh sepse ato kanë qenë në beta në aplikacionin ueb Firefly për të paktën një muaj (dhe Midjourney për shumë më gjatë se kaq). Kjo shënon debutimin e tyre në Photoshop – në beta.

Duke folur për aplikacionin në internet, Adobe nuk po e neglizhon këtë rrugë alternative për mjetet e saj të AI.

Për të koinciduar me publikimin e Image 3, aplikacioni në internet Firefly po merr Referencën e Strukturës dhe Referencën e Stilit, të cilat Adobe i paraqet si mënyra të reja për të “përparuar kontrollin krijues”. (Të dyja u njoftuan në mars, por tani po bëhen gjerësisht të disponueshme.) Me Referencën e Strukturës, përdoruesit mund të gjenerojnë imazhe të reja që përputhen me “strukturën” e një imazhi referencë – të themi, një pamje ballë për ballë të një makine garash. Referenca e stilit është në thelb transferimi i stilit me një emër tjetër, duke ruajtur përmbajtjen e një imazhi (p.sh., elefantët në safarin afrikan) duke imituar stilin (p.sh. skica me laps) të një imazhi të synuar.

Këtu është Referenca e Strukturës në veprim:

foto
foto

E pyeta Adobe nëse, me të gjitha përmirësimet, çmimi i gjeneratës së imazheve Firefly do të ndryshonte. Aktualisht, plani premium më i lirë i Firefly është 4,99 dollarë në muaj – duke ulur konkurrencën si Midjourney (10 dollarë në muaj) dhe OpenAI (i cili kalon DALL-E 3 pas një abonimi prej 20 dollarësh në muaj ChatGPT Plus ).

Adobe tha se nivelet e saj aktuale do të mbeten në vend për momentin, së bashku me sistemin e saj gjenerues të kredisë . Ai tha gjithashtu se politika e saj e dëmshpërblimit, e cila thotë se Adobe do të paguajë pretendimet për të drejtën e autorit në lidhje me veprat e krijuara në Firefly, nuk do të ndryshojë as, as qasja e saj për të shënuar përmbajtjen e krijuar nga AI. Kredencialet e përmbajtjes – meta të dhënat për të identifikuar mediat e krijuara nga AI – do të vazhdojnë të bashkëngjiten automatikisht në të gjitha gjeneratat e imazheve Firefly në ueb dhe në Photoshop, qofshin të krijuara nga e para ose të modifikuara pjesërisht duke përdorur veçori gjeneruese.