Google përmirëson Gemini-n me Deep Think dhe sinjalizon rreziqet e paralajmërimit të hershëm

foto

Google zbulon një version të ri të modelit të saj Gemini AI, i projektuar për të zgjidhur probleme komplekse duke i dhënë më shumë “kohë për të menduar”. Teknologjia ndërtohet mbi të njëjtin model që shkëlqeu së fundmi në Olimpiadën e Matematikës, por analiza e vetë Google sugjeron se kjo ngre edhe pyetje të reja për sigurinë.

Google ka lançuar një version më të fuqishëm të modelit të saj Gemini AI të quajtur Deep Think. Kompania thotë se funksioni i ri është i disponueshëm tani për abonentët e Google AI Ultra në aplikacionin Gemini. Sipas Google, ky publikim shënon një përmirësim të qartë në krahasim me versionin e zbuluar në I/O, duke u mbështetur si në reagimet e testuesve ashtu edhe në kërkimet e fundit.

Funksioni “Think i Thellë” mund të aktivizohet në aplikacion, por është i kufizuar në një numër të caktuar kërkesash në ditë. Ai përdor automatikisht mjete si ekzekutimi i kodit dhe Kërkimi në Google, dhe mund të ofrojë përgjigje shumë më të gjata se më parë.

Google thotë se Deep Think mbështetet në teknikat për të menduarit paralel. Qëllimi është të pasqyrojë mënyrën se si një person mund t’i qaset një problemi të vështirë nga disa drejtime njëherësh: gjenerimi, vlerësimi dhe kombinimi i ideve të shumta paralelisht për të gjetur përgjigjen më të mirë. Për ta bërë këtë, modelit i jepet kohë shtesë për të nxjerrë përfundime – më shumë “kohë për të menduar” përpara se të përgjigjet.

Qasje të ngjashme si Vetë-Konsistency, Tree-of-Thought dhe XOT kanë qenë në përdorim eksperimental më parë, por Deep Think shton metoda të reja të të mësuarit përforcues të dizajnuara për të ndihmuar modelin të përdorë këto shtigje të zgjeruara të arsyetimit në mënyrë produktive. Me kalimin e kohës, kjo duhet ta bëjë atë më të mirë në zgjidhjen e problemeve të vështira. Sipas kartës së modelit të tij, Gemini 2.5 përdor një arkitekturë të Përzierjes së Ekspertëve të Ndarë (MoE) dhe mbështet një dritare konteksti deri në një milion tokena për hyrje dhe 192,000 tokena për dalje.

foto

Google thotë se Deep Think është veçanërisht i fortë në detyrat që kërkojnë kreativitet dhe planifikim strategjik, si përmirësimi i vazhdueshëm i dizajnit të faqeve të internetit, mbështetja e kërkimit shkencor dhe matematikor dhe zgjidhja e sfidave komplekse të programimit.

Në testet krahasuese, Gemini 2.5 Deep Think jep rezultate të forta: 87.6% në LiveCodeBench V6 (gjenerimi i kodit) dhe 34.8% në Humanity’s Last Exam (njohuri dhe arsyetim logjik), duke mposhtur rivalë si OpenAI o3 dhe Grok 4 në mjedise ku nuk përdoren mjete të jashtme.

foto

Ky version publik është një variant i modelit që fitoi medaljen e artë në Olimpiadën Ndërkombëtare të Matematikës (IMO). Ndërsa versionit të IMO-s i duheshin orë të tëra për të zgjidhur problemet e tij, versioni publik është shumë më i shpejtë dhe i përshtatur për përdorim të përditshëm. Google thotë se ai ende arrin performancën e medaljes së bronztë në pikën referuese të IMO-s 2025. Modeli i plotë i nivelit të artë është i disponueshëm vetëm për një grup të zgjedhur matematikanësh dhe studiuesish.

Por me këtë hap të madh në aftësi, Google pranon probleme të reja sigurie. Karta e modelit detajon një shqyrtim gjithëpërfshirës të sigurisë sipas “Kornizës së Sigurisë Kufitare” (FSF), të shkaktuar nga “dallimet e jashtëzakonshme” nga modelet e mëparshme.