Microsoft po krijon programin e tij të gjenerimit të imazheve AI

foto

Gjatë një ngjarjeje për shtyp në Surface sot, Microsoft njoftoi integrimet e teknologjisë së gjenerimit të imazheve të fuqizuara nga AI në motorin e saj të kërkimit Bing, shfletuesin Edge dhe një aplikacion të ri të Office të quajtur Microsoft Designer. Teknologjia do të mundësohet nga DALL-E 2 nga OpenAI, e cila bëri bujë në prill për aftësinë e saj për të gjeneruar imazhe të reja bazuar në kërkesat e shkruara. Teknologjia ka qenë gjithashtu subjekt i zemërimit në mesin e disa artistëve për shkak të shqetësimeve etike.

Ofertat e Microsoft synojnë të ndihmojnë krijuesit të kapërcejnë sindromën e faqeve të zbrazëta duke sugjeruar drejtime kreative veprimi. Në një shembull të Microsoft Designer të ofruar nga Microsoft, dikush shkruan një përshkrim të asaj që dëshiron të shohë, si p.sh. “tortë Ombre e zbukuruar me lule dhe gjethe vjeshte” dhe më pas mund të lëvizin nëpër shembuj imazhesh të krijuara nga AI që mund të zgjedhin shtoni në dizajnin e tyre. “Designer ju fton të filloni me një ide dhe ta lini AI të bëjë ngritje të rënda”, shkroi Microsoft në një deklaratë për shtyp.

foto

Microsoft Designer filloi si pjesë e PowerPoint, ku aktualisht sugjeron idetë e dizajnit si një nëngrup i atij programi. Por Microsoft planifikon të shpërndajë Designer në aplikacionin e tij Microsoft 365 që do të jetë i disponueshëm si një aplikacion falas dhe si një aplikacion premium i disponueshëm për abonentët Personal dhe Family të Microsoft 365. Tani për tani, Microsoft po e kufizon Designer në një aplikacion publik falas në internet, të cilin do ta përdorë për të mbledhur reagime nga testimi publik.

foto

Microsoft njoftoi gjithashtu se do të integrojë Designer në Microsoft Edge për të ofruar “sugjerime të dizajnit të fuqizuara nga AI për të përmirësuar vizualisht postimet e mediave sociale dhe përmbajtje të tjera vizuale pa pasur nevojë të largoheni nga dritarja e shfletuesit tuaj”. Dhe sinteza e imazhit të AI do të vijë gjithashtu në Bing me Image Creator, ku njerëzit do të jenë në gjendje të shkruajnë një kërkesë dhe të marrin një rezultat të ri, të mundësuar nga DALL-E 2 i OpenAI.

Që kur OpenAI debutoi DALL-E 2 në prill, gjenerimi i imazheve të AI ka qenë i diskutueshëm me disa artistë për shkak të mënyrës se si funksionon. Modelet e sintezës së imazheve si DALL-E 2 përdorin rrjete nervore të të mësuarit të thellë për të analizuar miliona ose miliarda imazhe të gjetura publikisht në ueb pa kërkuar pëlqimin nga artistët ose mbajtësit e të drejtave të autorit. Këto modele, duke përfshirë konkurrentin DALL-E Stable Diffusion, lidhin statistikisht përmbajtjen e atyre imazheve me titrat përshkrues që gjenden në ueb për t’i lidhur ato me fjalë. Rezultati është se këto modele mund të gjenerojnë imazhe të bazuara në përshkrimet e tekstit dhe ato mund të imitojnë stilet dalluese të artistëve njerëzorë të veçantë.

Më tej, krijuesit e këtyre modeleve të sintezës së imazhit paralajmërojnë se ato pasqyrojnë paragjykime sociale si racizmi dhe seksizmi në të dhënat e tyre të trajnimit dhe janë gjithashtu të aftë të prodhojnë imazhe shqetësuese ose të paligjshme nëse nuk vendosen masa mbrojtëse. Microsoft thotë se po trajton këto çështje: “Për të ndihmuar në parandalimin e DALL∙E 2 nga ofrimi i rezultateve të papërshtatshme në aplikacionin Designer dhe Image Creator, ne po punojmë vetë dhe me partnerin tonë OpenAI, i cili zhvilloi DALL-E 2, për të ndërmarrë hapa dhe do të vazhdojmë të zhvillojmë qasjen tonë sipas nevojës.”

Zbutjet përfshijnë heqjen e “përmbajtjes më eksplicite seksuale dhe të dhunshme” nga grupi i të dhënave të trajnimit dhe shtimin e filtrave për “të kufizuar gjenerimin e imazheve që shkelin politikën e përmbajtjes”. Lidhur me paragjykimet, Microsoft përmend aplikimin e “teknologjisë shtesë që ndihmon në dhënien e imazheve më të ndryshme në rezultatet tona”, që ka të ngjarë të jetë e njëjtë me injeksionet e rastësishme të larmishme të shpejtë të OpenAI të prezantuara në DALL-E në korrik, e cila u përball me disa polemika vetë. Ndoshta për shkak të këtyre çështjeve, Microsoft po merr një qasje të lëshimit të ngadaltë në vend që të hapë plotësisht portat.

“Ne po marrim një qasje të matur për të nxjerrë në treg [Image Creator],” shkroi Microsoft në një deklaratë për shtyp. “Ne do të fillojmë së shpejti me një vrojtim të kufizuar për gjeografi të zgjedhura, e cila do të na lejojë të mbledhim komente, të zbatojmë mësimet dhe të përmirësojmë përvojën përpara se të zgjerojmë më tej.”

Me këto lëvizje nga Microsoft, mjetet e sintezës së imazhit po bëhen shpejt më të zakonshme. Canva shtoi aftësitë e gjenerimit të tekstit në imazh në mes të shtatorit.