Google lançoi Gemini 2.5 Flash

Pas detajimit të shkurtër të javës së kaluar, Google po nxjerr Gemini 2.5 Flash në pamje paraprake sot. Një “buxhet i menduar” i lejon zhvilluesit të kontrollojnë se sa arsyetim ndodh në varësi të rastit të kërkesës dhe përdorimit.
Të gjitha modelet në familjen Gemini 2.5 kanë aftësi arsyetimi që mendojnë “përmes mendimeve të tyre përpara se të përgjigjen” për “performancë të përmirësuar dhe saktësi të përmirësuar”. Kjo është ideale për kërkesat që kërkojnë arsyetim me shumë hapa, si problemet e matematikës dhe analizimi i pyetjeve kërkimore
Në vend që të gjenerojë menjëherë një rezultat, modeli mund të kryejë një proces “të menduari” për të kuptuar më mirë pyetjen, për të zbërthyer detyrat komplekse dhe për të planifikuar përgjigjen e tij.
Modelet Flash të Gemini njihen për shpejtësinë dhe koston më të ulët. Kjo nuk po ndryshon me 2.5 Flash, por Google po prezanton aftësitë e arsyetimit ku zhvilluesit janë në gjendje të “caktojnë buxhetet e të menduarit për të kontrolluar koston kundrejt cilësisë”.
Specifikimet kryesore për Gemini 2.5 Flash në pamje paraprake (gemini-2.5-flash-preview-04-17):
Kufijtë e normës: 1000 RPM / 10,000 RPD (niveli me pagesë), 10 RPM / 500 RPD (Klasa falas)
Përfundimi i njohurive: Janar 2025
Modalitetet e hyrjes: Tekst, Imazhe, Video, Audio
Modalitetet e daljes: Teksti
Dritarja e kontekstit: 1 milion argumente
Gjatësia maksimale e daljes: 64K argumente

Në mënyrë të veçantë, zhvilluesit kontrollojnë “numrin e shenjave që një model mund të gjenerojë ndërsa mendon” nga 0 në 24,576 token. Ekziston një rrëshqitës në Google AI Studio dhe Vertex AI, si dhe një parametër API. Në grafikët e mëposhtëm, mund të shihni se si përmirësohet cilësia e arsyetimit me rritjen e buxhetit.
Nëse buxheti i të menduarit është vendosur në zero, ky model i ri do të përputhet me koston dhe vonesën e Flash 2.0.

Nëse një buxhet nuk është i specifikuar, Gemini 2.5 Flash “vendos automatikisht se sa të mendohet bazuar në kompleksitetin e perceptuar të detyrës.” Google ofron shembuj të arsyetimit minimal, të mesëm dhe të lartë:
Kërkesa me arsyetim minimal:
“Faleminderit” në spanjisht
Sa provinca ka Kanadaja?
Kërkesat me arsyetim mesatar:
Ju hidhni dy zare. Sa është probabiliteti që ata të shtojnë deri në 7?
Palestra ime ka orët e marrjes së basketbollit midis orës 9-3 pasdite në MWF dhe ndërmjet orës 14-20 të martën dhe të shtunën. Nëse punoj 21-6 pasdite 5 ditë në javë dhe dua të luaj 5 orë basketboll gjatë ditëve të javës, krijoni një orar për mua që të funksionojë gjithçka.
Kërkesa me arsyetim të lartë:

Në kontekstin e agjentëve, një shembull tjetër është se si përmbledhjet e shpejta do të përfshinin një buxhet të ulët të të menduarit, ndërsa analiza e detajuar kërkon një buxhet më të lartë.
Gemini 2.5 Flash është i disponueshëm për shikim paraprak për zhvilluesit në Google AI Studio dhe Vertex AI. Google thotë se do të “vazhdojë të përmirësojë Gemini 2.5 Flash, me më shumë që vijnë së shpejti, përpara se ta bëjmë atë përgjithësisht të disponueshëm për përdorim të plotë të prodhimit”.
2.5 Flash (eksperimental) po vjen gjithashtu në aplikacionin Gemini me aftësinë për të rregulluar automatikisht sa arsyetim ndodh bazuar në kompleksitetin e kërkesës. Përdoruesit përfundimtarë nuk marrin asnjë lloj rregullimi manual në aplikacion.
Në fillim, mbështeten aftësitë e ndryshme të aplikacionit Gemini, si aplikacionet/Zgjatjet, ngarkimi i skedarëve, etj., ndërsa ky model do të zëvendësojë 2.0 Flash Thinking (eksperimental), i cili u përditësua për herë të fundit në mars.
