Gjenerimi më i fundit i videove dhe imazheve me Veo 2 dhe Imagen 3
Në fillim të këtij viti, ne prezantuam modelin tonë të gjenerimit të videove, Veo, dhe modelin tonë më të fundit të gjenerimit të imazheve, Imagen 3. Që atëherë, është emocionuese të shikosh njerëzit të sjellin idetë e tyre në jetë me ndihmën e këtyre modeleve: Krijuesit e YouTube po eksplorojnë mundësitë krijuese nga sfondet e videove për Shortet e tyre në YouTube, klientët e ndërmarrjeve po përmirësojnë flukset e punës krijuese në Vertex AI dhe krijuesit po përdorin VideoFX dhe ImageFX për të treguar historitë e tyre. Së bashku me bashkëpunëtorë duke filluar nga kineastët tek bizneset, ne po vazhdojmë t’i zhvillojmë dhe evoluojmë këto teknologji.
Sot po prezantojmë një model të ri video, Veo 2, dhe versionin më të fundit të Imagen 3, të cilat të dyja arrijnë rezultate të nivelit të lartë. Këto modele janë tani të disponueshme në VideoFX, ImageFX dhe eksperimentin tonë më të ri të Labs, Whisk.
Veo 2 krijon video me cilësi jashtëzakonisht të lartë në një gamë të gjerë subjektesh dhe stilesh. Në krahasimet kokë më kokë të gjykuar nga vlerësuesit njerëzorë, Veo 2 arriti rezultate më të avancuara kundrejt modeleve kryesore.
Ai sjell një kuptim të përmirësuar të fizikës së botës reale dhe nuancave të lëvizjes dhe shprehjes njerëzore, gjë që ndihmon në përmirësimin e detajeve dhe realizmit të saj në përgjithësi. Veo 2 kupton gjuhën unike të kinematografisë: kërkoni një zhanër, specifikoni një lente, sugjeroni efekte kinematografike dhe Veo 2 do të japë – me rezolucion deri në 4K dhe zgjatur në minuta. Kërkoni një pamje gjurmuese me kënd të ulët që rrëshqet në mes të një skene, ose një shkrepje nga afër në fytyrën e një shkencëtareje që shikon përmes mikroskopit të saj dhe Veo 2 e krijon atë. Sugjeroni “lentet 18 mm” në kërkesën tuaj dhe Veo 2 di të krijojë fotografinë me kënd të gjerë për të cilën njihet kjo lente, ose të turbullojë sfondin dhe të fokusohet në subjektin tuaj duke vendosur “thellësi të vogël të fushës” në kërkesën tuaj.
Ndërsa modelet e videove shpesh “halucinojnë” detaje të padëshiruara – gishta shtesë ose objekte të papritura, për shembull – Veo 2 i prodhon këto më rrallë, duke i bërë rezultatet më realiste.
Angazhimi ynë për sigurinë dhe zhvillimin e përgjegjshëm e ka udhëhequr Veo 2. Ne jemi matur qëllimisht në rritjen e disponueshmërisë së Veo-s, kështu që mund të ndihmojmë në identifikimin, të kuptuarit dhe përmirësimin e cilësisë dhe sigurisë së modelit, ndërkohë që e shpërndajmë ngadalë nëpërmjet VideoFX, YouTube dhe Vertex AI.
Ashtu si pjesa tjetër e modeleve tona të gjenerimit të imazheve dhe videove, daljet e Veo 2 përfshijnë një filigran të padukshëm SynthID që ndihmon në identifikimin e tyre si të krijuara nga AI, duke ndihmuar në zvogëlimin e shanseve të keqinformimit dhe atribuimit të gabuar.
Sot, ne po sjellim aftësitë tona të reja Veo 2 në mjetin tonë të gjenerimit të videove të Google Labs, VideoFX, dhe po zgjerojmë numrin e përdoruesve që mund t’i qasen. Vizitoni Google Labs për t’u regjistruar në listën e pritjes. Ne gjithashtu planifikojmë të zgjerojmë Veo 2 në YouTube Shorts dhe produkte të tjera vitin e ardhshëm.
Ne kemi përmirësuar gjithashtu modelin tonë të gjenerimit të imazheve Imagen 3 , i cili tani gjeneron imazhe më të ndritshme dhe të kompozuara më mirë. Tani mund të përshkruajë stile më të ndryshme arti me saktësi më të madhe – nga fotorealizmi te impresionizmi, nga abstrakti tek anime. Ky përmirësim ndjek gjithashtu kërkesat më besnikërisht dhe jep detaje dhe tekstura më të pasura. Në krahasimet krah për krah të rezultateve nga vlerësuesit njerëz kundrejt modeleve kryesore të gjenerimit të imazheve, Imagen 3 arriti rezultate më të fundit.
Duke filluar nga sot, modeli më i fundit Imagen 3 do të shpërndahet globalisht në ImageFX, mjeti ynë i gjenerimit të imazheve nga Google Labs, në më shumë se 100 vende. Vizitoni ImageFX për të filluar.
Whisk , eksperimenti ynë më i ri nga Google Labs, ju lejon të futni ose krijoni imazhe që përcjellin subjektin, skenën dhe stilin që keni në mendje. Më pas, mund t’i bashkoni dhe t’i ripërzieni për të krijuar diçka unike tuajën, nga një pelush dixhital deri te një kunj ose ngjitëse smalti.
Nën kapuçin, Whisk kombinon modelin tonë më të fundit Imagen 3 me aftësitë e të kuptuarit dhe përshkrimit vizual të Gemini. Modeli Gemini shkruan automatikisht një titull të detajuar të imazheve tuaja dhe më pas i ushqen ato përshkrime në Imagen 3. Ky proces ju lejon të ripërzieni lehtësisht subjektet, skenat dhe stilet tuaja në mënyra argëtuese dhe të reja.