Gemini 1.5 Pro i Google tani mund të dëgjojë

Përditësimi i Google për Gemini 1.5 Pro i jep veshët modelit. Modeli tani mund të dëgjojë skedarët audio të ngarkuar dhe të nxjerrë informacion nga gjëra të tilla si telefonatat e fitimeve ose audio nga videot pa pasur nevojë t’i referohet një transkripti të shkruar.

foto

Gjatë ngjarjes së tij Google Next, Google gjithashtu njoftoi se do të vërë Gemini 1.5 Pro në dispozicion të publikut për herë të parë përmes platformës së saj për të ndërtuar aplikacione AI, Vertex AI. Gemini 1.5 Pro u prezantua për herë të parë në shkurt.

foto

Ky version i ri i Gemini Pro, i cili supozohet të jetë modeli me peshë të mesme të familjes Gemini , tashmë e kalon modelin më të madh dhe më të fuqishëm, Gemini Ultra, në performancë. Gemini 1.5 Pro mund të kuptojë udhëzimet e ndërlikuara dhe eliminon nevojën për të rregulluar modelet, pretendon Google.

Gemini 1.5 Pro nuk është i disponueshëm për njerëzit pa qasje në Vertex AI dhe AI ​​Studio. Tani për tani, shumica e njerëzve ndeshen me modelet e gjuhës Gemini përmes chatbot-it Gemini. Gemini Ultra fuqizon chatbotin e avancuar Gemini, dhe megjithëse është i fuqishëm dhe gjithashtu i aftë të kuptojë komandat e gjata, nuk është aq i shpejtë sa Gemini 1.5 Pro.

Gemini 1.5 Pro nuk është i vetmi model i madh i AI nga Google që merr një përditësim. Imagen 2, modeli i gjenerimit tekst-në-imazh që ndihmon në fuqizimin e aftësive të gjenerimit të imazheve të Gemini, do të shtojë gjithashtu pikturë brenda dhe jashtë, të cilat i lejojnë përdoruesit të shtojnë ose heqin elementë nga imazhet. Google gjithashtu bëri të disponueshme veçorinë e saj të filigranit dixhital SynthID në të gjitha fotografitë e krijuara përmes modeleve Imagen. SynthID shton një filigran të padukshëm për shikuesin në imazhe që shënon origjinën e tij kur shikohet përmes një mjeti zbulimi.

Shumë nga veçoritë e reja të Imagen, veçanërisht pikturimi brenda dhe jashtë, kanë qenë pjesë e modeleve të tjera tekst-në-imazh si Stability AI’s Stable Cascade dhe Getty’s Generative AI nga iStock , për të mos përmendur disponueshmërinë më të gjerë të konsumatorëve në telefonat më të rinj Samsung Galaxy.

Google thotë se po parashikon gjithashtu publikisht një mënyrë për të bazuar përgjigjet e tij të AI me Google Search, në mënyrë që ata të përgjigjen me informacione të përditësuara. Kjo nuk është gjithmonë e dhënë me përgjigjet e prodhuara nga modelet e mëdha gjuhësore, ndonjëherë me qëllim; Google e ka penguar qëllimisht Binjakët që t’u përgjigjet pyetjeve në lidhje me zgjedhjet e vitit 2024 në SHBA.

Binjakët gjithashtu u kritikuan kohët e fundit për gjenerimin e fotove me njerëz historikisht të pasaktë.