Gemini po ndërlikohen
Javën e kaluar, Google debutoi Gemini 2.0. Familja e re e modeleve të AI që fuqizon chatbot-in e Google me të njëjtin emër vjen me aftësi të reja, si aftësia për të aksesuar drejtpërdrejt informacionin nga shërbime si “Kërkimi i Google” dhe për të krijuar në mënyrë origjinale imazhe dhe audio për t’i përfshirë në përgjigjet e tij. Google thotë se modelet e tij të fundit të AI janë ndërtuar për “epokën e re agjenturore” që po hyjmë, në të cilën AI mund të hyjë në internet dhe të përdorë mjete për t’i bërë gjërat për përdoruesit.
Që nga kjo javë, abonentët e Gemini Advanced kanë akses për të provuar një sërë modelesh të reja: Gemini 2.0 Flash Experimental, Gemini 2.0 Experimental Advanced dhe Gemini 1.5 Pro me Deep Research. Këto bashkohen me opsionet ekzistuese të standardit 1.5 Pro (për “detyrat komplekse”) dhe 1.5 Flash (për “ndihmën e përditshme”). Kontrollon që abonentët që paguajnë do të kenë mundësinë të provojnë funksione të reja herët. Por për një produkt që supozohet të heqë një pjesë të punës nga proceset e ndërlikuara si kërkimi i thelluar dhe, përfundimisht, detyrat me aksione më të larta si rezervimi i udhëtimeve, Gemini po bëhet gjithnjë e më i ndërlikuar për t’u kuptuar dhe përdorur.
Abonentët Gemini Advanced tani kanë gjithsej pesë modele Gemini për të zgjedhur. Ngarkesat më komplekse të punës kërkojnë më shumë burime, kështu që përdorimi i modeleve të ndryshme për detyra të ndryshme ka kuptim. Nëse një model më i thjeshtë Flash mund t’i përgjigjet një pyetjeje të caktuar po aq mirë sa një model Pro më kompleks, ekzekutimi i tij përmes Flash në vend të Pro do të kursejë pak fuqi kompjuterike – një shqetësim në rritje në hapësirën e AI.
Por një meny rënëse që i lejon përdoruesit të zgjedhin manualisht midis pesë modeleve të ndryshme për çdo pyetje të caktuar duket si një mënyrë jashtëzakonisht e mprehtë për të menaxhuar aftësitë e ndryshme të Gemini. Të mësosh detajet e modeleve me emra si 1.5 Flash dhe 1.5 Pro me Deep Research duket si një pyetje e madhe.
Gemini 1.5 Pro me Deep Research, për shembull, është i vetmi nga pesë që mund të kryejë funksionin Deep Research të Gemini që mbledh informacione nga dhjetëra apo edhe qindra burime për të krijuar raporte të detajuara. Gemini 2.0 Advanced, modeli më i ri, përgjithësisht më i mirë, ende nuk mund ta bëjë këtë. Nëse e kërkoni, do të bëjë diçka, por nuk do t’ju bëjë të ditur se pyetja juaj do të ishte më e përshtatshme për 1.5 me Deep Research.
Apeli i ndërfaqeve të AI në gjuhën natyrore, teorikisht, është se nuk keni nevojë të dini se si funksionojnë për t’i përdorur ato. Në ndryshim nga një aplikacion më tradicional, ku duhet të mësoni nuancat e UI dhe ku të gjeni funksione të ndryshme për të kryer detyra të ndërlikuara, me diçka si Gemini ose ChatGPT, nuk duhet të keni nevojë për njohuri të specializuara – vetëm një të arsyeshme të formuar mirë. pyetje. Shtresimi i një menyje modelesh abstrakte për të zgjedhur për çdo hyrje ( është kjo pyetje ndihmë e përditshme apo një detyrë komplekse? ) duket në kundërshtim me një nga karakteristikat më të vlefshme të këtij lloji të aplikacionit: afrueshmërinë.
Opsioni për të zgjedhur manualisht se në cilin model drejtohet pyetja juaj është një përfitim i arsyeshëm për abonentët e avancuar, por nuk duhet të jetë një kërkesë. Për ta bërë Gemini më të lehtë për t’u përdorur, do të doja të shikoja një version të ardhshëm që vendos se cili model është më i përshtatshmi për pyetjen tuaj automatikisht, pa mbikëqyrje manuale. Siç qëndron, Binjakët as nuk do t’ju bëjnë të ditur nëse keni përdorur modelin e gabuar për një detyrë të caktuar. A nuk supozohet që AI të thjeshtojë jetën tonë?
Android 16 Developer Preview 2 përmban një ndryshim interesant: e bën Google Keep një aplikacion sistemi, që do të thotë se nuk mund ta çinstalosh pa qasje rrënjësore. Në pamje të parë, kjo mund të duket më shumë si një bezdi se çdo gjë, por ka të ngjarë të thotë që Google ka plane të mëdha për aplikacionin e tij për marrjen e shënimeve, duke përfshirë integrime më të thella të sistemit – aftësinë për të nisur aplikacionin nga ekrani i kyçjes në telefonat Pixel. për shembull.
Jam i emocionuar për mundësinë. Unë e kam përdorur Keep për shënime të shpejta nga komoditeti për vite me radhë, por kurrë nuk më ka pëlqyer shumë. Krahasuar me aplikacionet e tjera që kam përdorur për mbajtjen e shënimeve – Evernote, Obsidian, Apple Notes – Keep më dukej gjithmonë pak i thjeshtë. Ju mund të kërkoni shënimet tuaja dhe të shtoni etiketa, por nuk ka kategorizim të fortë; ju nuk mund të krijoni dosje dhe aplikacioni është ende i kapur pas konceptit të tij origjinal të shënimeve të përfaqësuara si karta ngjitëse në stilin e shënimeve.
Por nëse Keep bëhet një fokus më i madh për Google, duke zgjedhur veçori si dosjet, disa kategorizime të inteligjencës artificiale të mbështetur nga Gemini dhe ndoshta një pllakë me cilësime të shpejta për të hapur një shënim të ri në Android siç ka Apple Notes në iOS, mund ta shoh veten duke e përdorur atë. sepse dua, dhe jo vetëm sepse është aplikacioni për mbajtjen e shënimeve që kam instaluar.
Gjeneratori i videove Veo 2 i Google po duket jashtëzakonisht mbresëlënës. Google publikoi këtë javë një grup videoklipesh (sipër) nga gjeneratori i tij i fundit i videove Veo 2, dhe në pjesën më të madhe, është shumë e vështirë të thuash që klipet nuk janë bërë nga dora e njeriut. Veo 2 me sa duket ka një kuptim më të mirë të gjërave si anatomia dhe fizika sesa Veo origjinale, gjë që e lejon atë të krijojë klipe që kanë dukshëm më pak AI dhe më pak halucinacione. Mund të regjistroheni për një listë pritjeje për të provuar vetë Veo 2 në labs.google/videofx.
Eksperimenti i ri i Google Whisk është një mjet për stuhi mendimesh vizuale. Whisk ju lejon të gjeneroni imazhe bazuar në një “cilësim”, “skenë” dhe “stili” të përcaktuar nga përdoruesi. Për çdo aspekt, mund të ngarkoni ose një imazh ekzistues ose të shkruani një kërkesë teksti. Ju gjithashtu keni mundësinë për të përmirësuar imazhet e daljes me nxitje shtesë. Rezultatet në përgjithësi nuk janë të cilësisë së lartë, por Google e pozicionon Whisk më shumë si një mjet për ide sesa krijimi i imazheve të gatshme për përdorim. Mund ta provoni Whisk tani në labs.google/fx/tools/whisk.
Kontrolluesit e fakteve të Gemini thuhet se po peshojnë tema për të cilat ata nuk dinë. Sipas raportimit nga TechCrunch, punonjësit me kontratë që vlerësojnë përgjigjet e Gemini nuk janë më në gjendje të anashkalojnë përgjigjet që bien jashtë kuptimit të tyre, me udhëzimet nga Google që thuhet se lexojnë pjesërisht, “Nuk duhet të kapërceni kërkesat që kërkojnë njohuri të specializuara për domenin”. Kjo është mjaft shqetësuese! Mos harroni të vazhdoni të kontrolloni dy herë informacionin e dhënë nga AI përpara se të veproni sipas tij.