Pamja paraprake e Stability AI-së Stable Diffusion 3 krenohet me aftësi superiore të gjenerimit të imazhit dhe tekstit
Stability AI njofton lëshimin paraprak të Stable Diffusion 3, i cili tregon përmirësim të ndjeshëm të cilësisë së përgjithshme të gjenerimit në demonstrimet e hershme.
Në mënyrë të veçantë, Stability AI premton performancë të përmirësuar në kërkesat me shumë pjesë, komplekse, cilësinë e imazhit dhe aftësitë e shkrimit të tekstit. CEO i Stability AI Emad Mostaque tregon një shembull se sa saktë Stable Diffusion 3 ekzekuton një kërkesë komplekse.
Nëse kjo funksionon gjithmonë në mënyrë të besueshme dhe sa përpjekje për imazh nevojiten për të arritur një rezultat të tillë, mbetet për t’u parë në praktikë. Sipas Mostaque, imazhi u krijua me një model bazë të parregulluar të Stable Diffusion 3. Demonstrimet në X deri më tani sugjerojnë një ndjekje të shpejtë edhe më të mirë se DALL-E 3 i OpenAI, i cili aktualisht është më i miri në klasë në këtë kategori.
Modelet Stable Diffusion 3 variojnë nga 800 milionë deri në 8 miliardë parametra dhe kombinojnë kërkime të reja për gjenerimin e imazheve nga vitet e fundit, duke përfshirë Arkitekturën e Transformerit të Difuzionit me Përputhjen e Rrjedhës . Një raport i detajuar teknik do të publikohet së shpejti, thotë Stability AI.
Modeli nuk është ende përgjithësisht i disponueshëm, por ekziston një listë pritjeje për të cilën mund të regjistroheni këtu . Faza paraprake përdoret për të përmirësuar performancën dhe sigurinë përpara “lëshimit të hapur”, thotë kompania.
Stabiliteti AI thotë se ka marrë masa paraprake të shumta sigurie për të parandaluar keqpërdorimin e modelit nga aktorë keqdashës, duke filluar me trajnimin dhe duke vazhduar përmes testimit, vlerësimit dhe vendosjes.
Kompania thekson bashkëpunimin e vazhdueshëm me studiuesit, ekspertët dhe komunitetin në zhvillimin dhe përdorimin publik të modelit. Për shkak se ato janë me burim të hapur dhe të rregullueshme mirë, modelet e Difuzionit të Qëndrueshëm janë objektiva të lehta për keqpërdorim në aplikacionet e diskutueshme të imazhit të AI.
Stable Diffusion është kritikuar dhe paditur gjithashtu për të dhënat e tij të trajnimit . Për Stable Diffusion 3, artistët hoqën paraprakisht miliona vepra nga të dhënat e trajnimit . Stabiliteti AI e shmangu këtë çështje në njoftimin e Stable Diffusion 3.
Stability AI ka lëshuar së fundmi disa modele të reja, duke përfshirë Stable Cascade, një model shumë i shpejtë tekst-në-imazh. Modele të tjera të reja përfshijnë Stable Video Diffusion (SVD) , një model video gjenerues që prodhon video të krijuara nga AI me lëvizje dhe qëndrueshmëri të përmirësuar, dhe Stable Zero123 , një model për aplikacionet tekst-në-3D.