Stability AI lançon Stable Diffusion 3, modelin e tij më të sofistikuar të gjenerimit të imazheve deri më tani
Stability AI lançoi sot Stable Diffusion 3 Medium, të cilin startup- i britanik e quan “modeli i tij më i avancuar i hapur tekst-në-imazh deri më tani”.
I përbërë nga 2 miliardë parametra, SD3 Medium premton rezultate fotorealiste pa rrjedha komplekse pune. Më e rëndësishmja, modeli mund të gjenerojë këto imazhe ndërsa funksionon në sisteme individuale të konsumatorëve.
Ai gjithashtu kapërcen artefaktet e zakonshme në duar dhe fytyra, tha Stabiliteti.
Kompania ndërtoi SD3 Medium për të kuptuar kërkesat komplekse që përfshijnë marrëdhëniet hapësinore, elementet kompozicionale, veprimet dhe stilet.
Është përmirësuar gjithashtu tipografia. Stabiliteti e përshkroi saktësinë e gjenerimit të tekstit si “të pashembullt”. Kompania ia atribuon këto përmirësime arkitekturës së Transformerit të Difuzionit.
Një tjetër tërheqje kryesore është madhësia e modelit. Me 2 miliardë parametra, modeli është më i vogël se shumë modele Stable Diffusion 3, të cilat variojnë nga 800 milion në 8 miliardë parametra.
Falë gjurmës së ulët të VRAM, SD3 Medium është “ideal” për funksionimin në GPU standarde të konsumatorit pa degradim të performancës, tha Stability. Ai gjithashtu mund të thithë detaje të nuancuara nga grupet e vogla të të dhënave, gjë që rrit personalizimin.
Christian Laforte, bashkë-CEO i Stability, i tha TNW se startup planifikon të përmirësojë vazhdimisht modelin.
“Stability AI do të vazhdojë të shtyjë kufijtë e AI gjeneruese dhe do të synojë të ruajë udhëheqjen e saj në ballë të gjenerimit të imazheve”, tha ai.
Përdoruesit tani mund të testojnë SD3 Medium nëpërmjet API -së së Stabilitetit. Peshat e modelit janë të disponueshme nën një licencë të hapur jo-tregtare dhe një licencë krijuesi me kosto të ulët. Kushdo që është i interesuar për përdorim komercial në shkallë të gjerë mund të kontaktojë startupin për detajet e licencimit.
SD3 Medium arrin në kohë të trazuara për Stabilitet.
E themeluar në vitin 2020, startup-i u vlerësua shpejt si një nga udhëheqësit në zhvillim të AI gjeneruese. Krahas rivalëve Midjourney dhe Dall-E të OpenAI, Stable Diffusion u ngrit në majën e nën-sektorit të sapolindur tekst-në-imazh. Në vitin 2022, investitorët e vlerësuan startup-in në 1 miliard dollarë.
Megjithatë, që atëherë, një mori padish dhe shqetësimesh financiare kanë përfshirë biznesin.
Artistët kanë paditur kompaninë për trajnimin e modeleve të saj të AI për punën e tyre pa pëlqim. Stabiliteti ka diskutuar gjithashtu një shitje pasi përballet me një krizë parash, raportoi The Information muajin e kaluar.
Ndërsa problemet u shtuan, CEO dhe themeluesi i kompanisë, Emad Mostaque, dha dorëheqjen në mars. Mostaque tha se ai po largohej për të ndjekur AI të decentralizuar.
Softueri, megjithatë, ka bërë vazhdimisht përshtypje. Imazhet nga SD3 Medium sugjerojnë se performanca është përmirësuar më tej.
Përmirësime të mëtejshme janë tashmë në proces – dhe jo vetëm për imazhet. Sipas Laforte, kompania po përqendrohet gjithashtu në “përpjekjet multimodale në video, audio dhe gjuhë”.