Gemini 1.5 është modeli i gjeneratës së ardhshme të inteligjencës artificiale të Google – dhe tashmë është pothuajse gati

Mezi dy muaj pas lançimit të Gemini, modeli i madh gjuhësor që Google shpreson ta sjellë atë në krye të industrisë së AI, kompania tashmë po shpall pasardhësin e saj. Google po lançon Gemini 1.5 sot dhe e bën atë të disponueshëm për zhvilluesit dhe përdoruesit e ndërmarrjeve përpara një prezantimi të plotë të konsumatorëve që vjen së shpejti. Kompania e ka bërë të qartë se është në dispozicion të Gemini si një mjet biznesi, një asistent personal dhe gjithçka në mes, dhe po e shtyn fort atë plan.

foto

Ka shumë përmirësime në Gemini 1.5: Gemini 1.5 Pro, modeli për qëllime të përgjithshme në sistemin e Google, me sa duket është në të njëjtin nivel me Gemini Ultra të nivelit të lartë që kompania lançoi vetëm kohët e fundit , dhe e kaloi Gemini 1.0 Pro me 87 përqind të testeve standarde. Është bërë duke përdorur një teknikë gjithnjë e më të zakonshme të njohur si “Përzierja e ekspertëve”, ose MM, që do të thotë se ekzekuton vetëm një pjesë të modelit të përgjithshëm kur dërgoni një pyetje, në vend që të përpunojë të gjithën gjatë gjithë kohës. ( Këtu është një shpjegues i mirë për këtë temë .) Kjo qasje duhet ta bëjë modelin më të shpejtë për t’u përdorur dhe më efikas për ekzekutimin e Google.

foto

Por ka një gjë të re në Gemini 1.5 që e ka të gjithë kompaninë, duke filluar me CEO Sundar Pichai, veçanërisht të emocionuar: Gemini 1.5 ka një dritare të madhe konteksti, që do të thotë se mund të trajtojë pyetje shumë më të mëdha dhe të shikojë shumë më tepër informacion në të njëjtën kohë. Kjo dritare është 1 milion argumente, krahasuar me 128,000 për GPT-4 të OpenAI dhe 32,000 për Gemini Pro aktual. Shenjat janë një metrikë e ndërlikuar për t’u kuptuar ( këtu është një përmbledhje e mirë ), kështu që Pichai e bën më të thjeshtë: “Është rreth 10 ose 11 orë video, dhjetëra mijëra rreshta kodi.” Dritarja e kontekstit do të thotë që ju mund të pyesni robotin e AI për të gjithë atë përmbajtje menjëherë.

(Pichai thotë gjithashtu se studiuesit e Google po testojnë një dritare konteksti prej 10 milionë token – kjo është, si, e gjithë seria e Game of Thrones menjëherë.)

Teksa po ma shpjegon këtë, Pichai vëren pa dashje se ju mund ta vendosni të gjithë trilogjinë e Lord of The Rings në atë dritare konteksti. Kjo më duket shumë specifike, ndaj e pyes: kjo ka ndodhur tashmë, apo jo? Dikush në Google thjesht po kontrollon për të parë nëse Gemini vë në dukje ndonjë gabim në vazhdimësi, duke u përpjekur të kuptojë linjën e ndërlikuar të Tokës së Mesme dhe duke parë nëse ndoshta AI më në fund mund t’i japë kuptim Tom Bombadil. “Jam i sigurt se ka ndodhur,” thotë Pichai duke qeshur, “ose do të ndodhë – një nga të dyja.”

Pichai gjithashtu mendon se dritarja më e madhe e kontekstit do të jetë jashtëzakonisht e dobishme për bizneset. “Kjo lejon përdorimin e rasteve ku mund të shtoni shumë kontekst dhe informacion personal në momentin e pyetjes,” thotë ai. “Mendojeni këtë pasi ne kemi zgjeruar në mënyrë dramatike dritaren e pyetjeve.” Ai imagjinon se kineastët mund të ngarkojnë të gjithë filmin e tyre dhe të pyesin Binjakët se çfarë mund të thonë recensentët; ai sheh kompanitë që përdorin Gemini për të parë masat e të dhënave financiare. “Unë e shoh atë si një nga përparimet më të mëdha që kemi bërë,” thotë ai.

Për momentin, Gemini 1.5 do të jetë i disponueshëm vetëm për përdoruesit e biznesit dhe zhvilluesit, përmes Vertex AI dhe AI ​​Studio të Google. Përfundimisht, ai do të zëvendësojë Gemini 1.0 dhe versioni standard i Gemini Pro – ai i disponueshëm për të gjithë në gemini.google.com dhe në aplikacionet e kompanisë – do të jetë 1.5 Pro me një dritare konteksti 128,000 token. Ju do të duhet të paguani ekstra për të arritur në milion. Google po teston gjithashtu sigurinë dhe kufijtë etikë të modelit, veçanërisht në lidhje me dritaren e re të kontekstit më të madh.

Google është në një garë marramendëse për të ndërtuar mjetin më të mirë të AI tani, ndërsa bizneset në mbarë botën përpiqen të kuptojnë strategjinë e tyre të AI – dhe nëse do të nënshkruajnë marrëveshjet e tyre të zhvilluesve me OpenAI, Google ose dikë tjetër. Vetëm këtë javë, OpenAI njoftoi “memorie” për ChatGPT dhe duket se po përgatitet për një shtytje në kërkimin në internet . Deri më tani, Gemini duket të jenë mbresëlënës, veçanërisht për ata që tashmë janë në ekosistemin e Google , por ka shumë punë për të bërë nga të gjitha anët.

Përfundimisht, më thotë Pichai, të gjitha këto 1.0 dhe 1.5 dhe Pro dhe Ultra dhe betejat e korporatave nuk do të kenë shumë rëndësi për përdoruesit. “Njerëzit thjesht do të konsumojnë përvojat,” thotë ai. “Është si të përdorësh një smartphone pa i kushtuar gjithmonë vëmendje procesorit poshtë.” Por në këtë moment, thotë ai, ne jemi ende në fazën ku të gjithë e njohin çipin brenda telefonit të tyre, sepse ka rëndësi. “Teknologjia themelore po zhvendoset kaq shpejt,” thotë ai. “Njerëzve u interesojnë.”