Google njofton Gemini 3.5 Live Translate për përkthim të menjëhershëm zë më zë

foto

Google ka vite që ndjek përkthimin në kohë reale, të cilin e quan një nga “eksperimentet e saj pioniere të të mësuarit automatik”. Kemi parë demo të shumta në skenë në ngjarjet e Google në të kaluarën, por ju duheshin telefona Google, kufje ose ndonjë konfigurim tjetër specifik. Vitin e kaluar, Google solli përkthimin në kohë reale për më shumë përdorues në aplikacionin Translate, dhe tani po e zgjeron më shumë disponueshmërinë. Me publikimin e Gemini 3.5 Live Translate, do të keni qasje në përkthim të menjëhershëm në më shumë vende dhe me vonesë më të ulët se kurrë më parë.

foto

Modeli i ri i IA-së është pjesë e familjes së versionit 3.5 që u lançua në I/O. Deri më sot, Google kishte lançuar vetëm versionin Flash, por presim që një model Pro të dalë në javët në vijim. Gemini 3.5 Live Translate është një model i konvertimit të të folurit në të folur i akorduar për të zbuluar dhe përkthyer automatikisht në më shumë se 70 gjuhë.

foto

Google thotë se Gemini 3.5 Live Translate është mjaftueshëm i shpejtë për të vazhduar një bisedë normale, duke ndjekur vetëm disa sekonda pas folësit, ndërkohë që përputhet edhe me intonacionin, ritmin dhe lartësinë e zërit. Shkurt, zëri tingëllon më shumë si i juaji sesa si një robot i zakonshëm. Demot, të cilat po regjistrohen të gjitha në kushte të kontrolluara, tingëllojnë mbresëlënëse. Megjithatë, nuk do të duhet të prisni gjatë për të verifikuar vetë aftësitë e modelit.

Gemini 3.5 Live Translate po shpërndahet në disa pjesë të ekosistemit Google. Zhvilluesit mund të fillojnë ndërtimin me një pamje paraprake publike në Gemini Live API ose AI Studio. Modeli përpunon të folurit vazhdimisht dhe trajton të gjitha hyrjet shumëgjuhëshe automatikisht, duke i kursyer zhvilluesit nga konfigurimi manual i cilësimeve. Ai gjithashtu filtron zhurmën e sfondit në mjedise të ngarkuara.

Klientë të zgjedhur të ndërmarrjeve do të kenë gjithashtu qasje në modelin e ri të përkthimit në Google Meet duke filluar këtë muaj, përpara një shpërndarjeje më të gjerë. Google thotë se po përmirëson ndërfaqen e Meet për të sjellë edhe funksionin e përkthimit të drejtpërdrejtë në plan të parë. Më e rëndësishmja, 3.5 Live Translate do të vijë së shpejti në aplikacionin Google Translate si në Android ashtu edhe në iOS.

Në fund të vitit të kaluar, Google filloi të testonte përkthimin e drejtpërdrejtë të bazuar në Gemini në aplikacion me çdo kufje (dhe në aplikacionin iOS); më parë, duhej të kishe kufjet Pixel Buds të kompanisë me një telefon Android. Përditësimi i ardhshëm do të zgjerohet më tej me shtimin e modelit më të fundit 3.5. Jo vetëm që mund të përdorni çdo kufje, por nuk keni nevojë fare për kufje. Nëse nuk keni asnjë në dorë, mund ta mbani telefonin pranë veshit tuaj sikur të jeni në një telefonatë për të dëgjuar përkthimin me zë. Megjithatë, ky “modalitet dëgjimi” funksionon vetëm në Android për momentin.

Transmetimet audio nga Gemini 3.5 Live Translate kanë për qëllim të tingëllojnë si realiste edhe nëse nuk e imitojnë saktësisht zërin e përdoruesit. Megjithatë, Google po vazhdon me kujdes. Të gjitha transmetimet audio të Gemini 3.5 Live Translate do të kenë filigrana SynthID të integruara në të dhënat e formës së valës. Kjo do ta shënojë fjalimin si të gjeneruar nga IA dhe (aktualisht) nuk ka asnjë mënyrë për ta hequr atë.