Google zbulon Gemini 2.0 Flash Thinking, shënon një hap të ri në arsyetimin e AI
Google ka lançuar një model eksperimental të AI, Gemini 2.0 Flash Thinking, i krijuar për të trajtuar pyetje komplekse me një qasje “arsyetimi”. Ky model pozicionohet si një konkurrent i drejtpërdrejtë i sistemit të arsyetimit GPT-4 Turbo të OpenAI, një lojtar kyç në fokusin e vazhdueshëm të fushës së AI në përmirësimin e aftësive vendimmarrëse të AI.
I prezantuar nga shkencëtari kryesor i Google DeepMind, Jeff Dean dhe drejtuesi i produkteve të AI Studio, Logan Kilpatrick , modeli i ri synon të përmirësojë arsyetimin duke ofruar jo vetëm përgjigje, por edhe duke ofruar një shpjegim të procesit të të menduarit pas tyre. Google pretendon se modeli mund t’i zbërthejë problemet në detyra më të vogla dhe më të menaxhueshme për të gjeneruar rezultate më të sakta. Ndërsa nuk përsërit saktësisht arsyetimin njerëzor, shpjegoi gjigandi i kërkimit, kjo procedurë rrit aftësinë e AI për të zgjidhur probleme të ndërlikuara, veçanërisht në fusha si programimi, matematika dhe fizika.
Dean shtoi se Gemini 2.0 Flash Thinking shfrytëzon shpejtësi më të shpejta llogaritëse, falë themelimit të tij në modelin Gemini 2.0 Flash. Gjatë një demonstrimi, modeli u tregua se zgjidhte një problem fizik duke shpjeguar arsyetimin e tij hap pas hapi, duke treguar se si arriti në përfundime. Kilpatrick theksoi gjithashtu aftësinë e modelit për të trajtuar detyra multimodale, të tilla si kombinimi i të dhënave vizuale dhe tekstuale për arsyetim më të plotë.
Pavarësisht karakteristikave të tij premtuese, modeli është ende në fazat e hershme, me hapësirë për përmirësim. Përdoruesit mund të eksperimentojnë me Gemini 2.0 Flash Thinking përmes platformës AI Studio të Google, e cila u lejon zhvilluesve të prototipojnë zgjidhjet e AI. Gjigandi i kërkimit e përshkroi modelin si ideal për “kuptim multimodal, arsyetim dhe kodim”, me një theks të veçantë në zgjidhjen komplekse të problemeve në disiplina të ndryshme.
Qasja e AI ndaj arsyetimit ndryshon nga modelet e tjera të AI në atë që ndalon përpara se t’u përgjigjet kërkesave, duke përdorur zgjidhje të shumta të mundshme dhe duke shpjeguar procesin e saj të arsyetimit. Sidoqoftë, modeli nuk është pa kufizime. Në një test, kur u pyet se sa “R” kishte në fjalën “luleshtrydhe”, ai gabimisht u përgjigj “dy”.
Lansimi i Google vjen në një kohë kur fusha e modeleve të arsyetimit po evoluon me shpejtësi. Jo vetëm që OpenAI ka vënë në dispozicion modelin e tij GPT-4 Turbo për përdoruesit e ChatGPT, por kompani të tjera, duke përfshirë DeepSeek dhe Alibaba, po zhvillojnë gjithashtu modele konkurruese. Në nëntor, DeepSeek prezantoi DeepSeek-R1 dhe Alibaba zbuloi një sfidues të ri për o1, duke intensifikuar më tej konkurrencën.
Përveç lançimit të modelit të tij të arsyetimit, Google thuhet se po planifikon të integrojë aftësitë e AI në funksionet e tij të kërkimit. Kompania është vendosur të prezantojë një opsion AI Mode që do t’i lejojë përdoruesit të përfshihen në shkëmbime bisedore me një chatbot të ngjashëm me Binjakët direkt në faqen e rezultateve të kërkimit. Ky funksion, që pritet të jetë i disponueshëm së shpejti, do t’u ofrojë përdoruesve mundësinë për të bërë pyetje pasuese dhe për të përfshirë lidhje të jashtme për eksplorim të mëtejshëm.
Ndërkohë, në sfondin e këtyre zhvillimeve, një studim i kohëve të fundit nga ekipi i Alignment Science i Anthropic ka hedhur dritë mbi një çështje në zhvillim brenda modeleve të mëdha gjuhësore (LLM) të quajtur “shtrirje e shtrirjes”. Kjo çështje, e identifikuar në bashkëpunim me Redwood Research, i referohet rasteve kur modelet duket se janë në përputhje me objektivat e tyre të trajnimit, por fshehtas mbajnë paragjykime ose preferenca nga fazat e mëparshme të trajnimit. Hulumtimi, i cili përfshinte testimin me modelet Claude të Anthropic, tregoi se si të mësuarit përforcues mund të luftojë për të siguruar sisteme vërtet të harmonizuara të AI, duke theksuar më tej sfidat me të cilat përballen zhvilluesit që punojnë në sisteme shumë inteligjente dhe vetë-mësuese AI.