Gemini 2.5 Pro është këtu me numra më të mëdhenj dhe energji pozitive

foto

Vetëm pak muaj pasi publikoi modelet e tij të para Gemini 2.0 AI, Google po përmirëson sërish. Kompania thotë se Gemini 2.5 Pro Experimental i ri është modeli i tij “më inteligjent” deri më tani, duke ofruar një dritare të gjerë konteksti, multimodalitet dhe aftësi arsyetimi. Google vë në dukje një sërë standardesh që tregojnë se Gemini-i i ri vë në lëvizje modele të tjera të mëdha gjuhësore (LLM) dhe testimi ynë duket se e mbështet këtë Gemini 2.5 Pro është një nga modelet më mbresëlënëse gjeneruese të AI që kemi parë.

Gemini 2.5, si të gjitha modelet e Google në vazhdim, ka arsyetim të integruar. Inteligjenca artificiale në thelb kontrollon vetveten gjatë rrugës për të gjeneruar një rezultat. Ne na pëlqen ta quajmë këtë ” arsyetim të simuluar “, pasi nuk ka asnjë provë që ky proces është i ngjashëm me arsyetimin njerëzor. Sidoqoftë, mund të shkojë shumë në përmirësimin e rezultateve të LLM. Google përmend në mënyrë specifike aftësitë koduese “agjentike” të modelit si përfitues të këtij procesi. Gemini 2.5 Pro Experimental, për shembull, mund të gjenerojë një lojë video të plotë funksionale nga një kërkesë e vetme. Ne e kemi testuar këtë dhe funksionon me versionin publik të modelit.

Google thotë shumë gjëra për Gemini 2.5 Pro; është më i zgjuar, është i vetëdijshëm për kontekstin, mendon – por është e vështirë të përcaktosh sasinë e asaj që përbën përmirësim në robotët gjenerues të AI. Megjithatë, ka disa avantazhe të qarta teknike. Gemini 2.5 Pro vjen me një dritare konteksti prej 1 milion token, e cila është e zakonshme për modelet e mëdha Gemini, por masive në krahasim me modelet konkurruese si OpenAI GPT ose Anthropic Claude. Ju mund t’i jepni Gemini 2.5 Pro shumë libra shumë të gjatë në një kërkesë të vetme, dhe prodhimi arrin në 64,000 argumente. Është njësoj si Flash 2.0, por objektivisht ka shumë argumente në krahasim me LLM-të e tjera.

Natyrisht, Google ka ekzekutuar Gemini 2.5 Experimental përmes një baterie standardesh, në të cilat ka rezultate pak më të larta se sistemet e tjera të AI. Për shembull, ajo rrëmbehet me o3-mini të OpenAI-t në GPQA dhe AIME 2025, të cilat matin se sa mirë AI u përgjigjet pyetjeve komplekse rreth shkencës dhe matematikës, përkatësisht. Ai vendosi gjithashtu një rekord të ri në standardin e provimit të fundit të Humanity, i cili përbëhet nga 3000 pyetje të kuruara nga ekspertë të fushës. Inteligjenca artificiale e re e Google arriti një rezultat prej 18.8 për qind ndaj OpenAI 14 për qind.

foto

Nuk është e qartë se sa efektive janë këto përpjekje për të matur në mënyrë objektive aftësitë e AI. Ndonjëherë, një vlerësim subjektiv i AI mund të jetë më i dobishëm – ” vibemarking ” nëse dëshironi. Inteligjenca artificiale e re e Google është tashmë në krye të tabelës së liderëve të arenës LMSYS Chatbot, e cila është një arritje e dukshme. Kjo tregon se përdoruesit në përgjithësi preferojnë prodhimin e Gemini 2.5 Pro Experimental ndaj asaj që do të merrnit nga OpenAI o3-mini, Grok, DeepSeek dhe të tjerët.

Vizat që marrim gjatë përdorimit të Gemini 2.5 Pro Experimental janë gjithashtu të mira. Ne hodhëm disa detyra komplekse në Gemini 2.5 – gjëra që shpesh ngatërronin modelet 2.0 – dhe AI ​​i përditësuar i trajtoi ato shumë më mirë. Pyetjet e kodimit, matematikës dhe shkencës janë gjithashtu në tendencë më të mirë se ajo që pamë me versionet e mëparshme të Gemini.

Modeli i ri pro i Google gjithashtu po shpërthen shpejt. Ai ende vazhdon si modelet e tjera, duke nxjerrë shenja ndërsa “arsyet” rrugën e tij drejt një përgjigjeje, por gjithçka ndihet më shpejt se edhe modelet më të fundit OpenAI dhe Anthropic. Google ka në dispozicion një ton llogaritjesh të AI, e cila padyshim po përdoret me efekt të madh këtu. Kjo është gjithashtu arsyeja pse modelet e Gemini si Gemini 2.5 Pro Experimental kanë dritare të tilla konteksti të mprehta – në këtë rast, është rreth pesë herë më e madhe se kufiri i hyrjes së o3-mini. Dhe ky është vetëm ndalesa e parë. Google thotë se dritarja e kontekstit do të rritet së shpejti në 2 milion argumente.

foto

Modeli 2.0 Pro i Google dukej mjaft mbresëlënës kur u lançua disa muaj më parë, por AI është zhdukur. Google thotë se Gemini 2.5 Pro është një zëvendësim për 2.0 që do të jetë i disponueshëm në të gjithë produktet e Google për këdo që ka një abonim Gemini Advanced (20 dollarë në muaj). Modeli i ri është i disponueshëm tani në aplikacionin celular dhe në ueb, si dhe në Studion AI të Google. Së shpejti do të jetë në Vertex AI.

Google nuk ka shpallur ende çmimin e API-së për Gemini 2.5 Pro Experimental, por gjithsesi nuk do të mund të bëni shumë me të tani. Google ka vendosur të njëjtin kufi ditor prej 50 mesazhesh si modelet e tij të vjetra eksperimentale dhe është falas për momentin. Kjo do të ndryshojë, megjithatë. Logan Kilpatrick i Google tha në X (ish Twitter) se 2.5 Pro Experimental do të jetë modeli i parë eksperimental me kufij dhe çmime më të larta API. Për këtë do të ketë një njoftim më vonë.