Google Gemini po trondit radhët drejtuese të inteligjencës artificiale së saj

foto

Google po zëvendëson liderin e aplikacioneve të tij të inteligjencës artificiale për konsumatorë pasi fokusi i garës së AI zhvendoset nga modelet themelore te produktet e ndërtuara rreth tyre, sipas memove të shqyrtuara nga Semafor.

foto

Sissie Hsiao, e cila udhëhoqi përpjekjet e Google për të krijuar një chatbot me AI, i quajtur fillimisht Bard dhe tani i quajtur Gemini, do të japë dorëheqjen menjëherë. Josh Woodward, i cili drejton Google Labs dhe mbikëqyri lëshimin e NotebookLM, mjeti popullor i kompanisë që e kthen tekstin në një shfaqje të ngjashme me podcast, do ta zëvendësojë atë.

foto

Në një memo për stafin, CEO i Google DeepMind, Demis Hassabis tha se masa do të “mprehë fokusin tonë në evolucionin e ardhshëm të aplikacionit Gemini”. Ai tha se Woodward do të mbetet kreu i Google Labs ndërsa do të formojë kapitullin tjetër të Gemini.

Hsiao, në një memo të veçantë të stafit, e quajti kohën e saj si drejtuese e ekipit “kapitulli 1” i tregimit të Bard dhe tha se ishte optimiste në dorëzimin e stafetës Woodward për “kapitullin 2”. Hsiao planifikon të marrë një “pauzë të shkurtër” dhe të kthehet në Google në një rol të ri.

Hsiao, Woodward dhe Hassabis nuk pranuan të komentojnë përmes një zëdhënësi.

Hsiao, një veteran 19-vjeçar i Google, u hodh në veprim pasi ChatGPT përmbysi industrinë e teknologjisë, duke e detyruar Google të përshpejtojë përhapjen e teknologjisë AI që kishte krijuar.

Ndërsa studiuesit e Google kishin qenë pionierë në arkitekturën e bazuar në transformator që lejoi krijimin e modeleve të mëdha gjuhësore që mundësonin ChatGPT, natyra e tij e paparashikueshme e bëri kompaninë të mbante eksperimentet e saj chatbot kryesisht të fshehta.

Në nxitimin e konkurrencës, fatkeqësitë ilustruan pse. Lancimi i Bard u kritikua për “halucinacione” dhe mjeti i tij për krijimin e imazhit Binjakët u bë një objektiv i konservatorëve kur gjeneroi rezultate të sikletshme, duke futur foto të grave ose njerëzve me ngjyrë kur u nxitën të krijonin imazhe të vikingëve, nazistëve dhe Papës.

Por Google i kaloi shpejt ato gabime të hershme me lansimet e suksesshme të produkteve. Javën e kaluar, Gemini 2.5 hodhi poshtë standardet e AI të mbajtura nga konkurrentët si OpenAI dhe Anthropic. Ajo mori drejtimin në Chatbot Arena, ku përdoruesit votojnë për përgjigjet e tyre të preferuara të modelit të gjuhës së madhe.

Ndërsa aplikacioni Gemini zuri në qendër të vëmendjes, ekipi i Google Labs i Woodward po krijonte prototipe të shpejta të produkteve të reja të konsumit të mundësuar nga modelet e AI të kompanisë.

Një eksperiment, NotebookLM, ishte një sukses i jashtëzakonshëm. Përdoruesit mund të ngarkojnë dokumente të mëdha teksti dhe modeli e kthen atë në diçka të ngjashme me një episod të një podcast, ku dy hostë të gjeneruar nga AI diskutojnë përmbajtjen e tekstit.

Ekipi i Woodward ndërtoi gjithashtu Project Mariner, një agjent i AI që mund të kontrollojë shfletuesin Chrome, të lundrojë në ueb dhe të ndërmarrë veprime autonome, si plotësimi i formularëve dhe mbledhja e informacionit. (Mariner nuk është lëshuar ende për të gjithë përdoruesit.)

Duke vendosur Woodward në krye të Gemini, Hassabis shpreson se ai do të ndihmojë në shfrytëzimin e aftësive kërkimore të kompanisë duke gjetur mënyra për të mbështjellë produkte miqësore për përdoruesit rreth modeleve të sofistikuara.

Ndryshimi i lidershipit në Gemini, të cilit kompania i referohet nga brenda si “Ekipi Bard”, pasqyron një fazë të re të garës së AI, ku skelat e produkteve të ndërtuara rreth modeleve të AI janë po aq të rëndësishme sa vetë modelet.

Kjo është, pjesërisht, sepse modelet kanë arritur një nivel aftësie ku ato mund të përdoren për më shumë se eksperimente të reja. Kompanitë si Cursor (për koduesit) dhe Harvey (për avokatët) po ndërtojnë biznese të suksesshme duke paketuar AI në një mënyrë që e bën teknologjinë më të dobishme dhe të aksesueshme për konsumatorët.

Java e kaluar ishte një ilustrim i përsosur i fenomenit. Google lëshoi ​​​​Gemini 2.5, ndoshta modeli më i mirë i AI në botë, por ai mori më pak vëmendje sesa gjeneratori i ri i imazhit të OpenAI, një produkt i matur që u bë viral në mediat sociale.

Hsiao ishte një zgjedhje e mirë për të udhëhequr Bard-in pasi kompania po detyrohej të kalonte nga një gjigant i madh dhe i qëllimshëm në diçka që i ngjante një startup-i me lëvizje të shpejtë. Qëndrimi i saj i gjatë në kompani mund të shërbejë si një urë lidhëse midis dy kulturave.

Por nuk ka dyshim se periudha e tranzicionit ka përfunduar. Është koha që kompania të fillojë të hedhë më shumë spageti në mur dhe të ndërtojë shumë më tepër NotebookLM dhe Project Mariners.

Në të njëjtën kohë, ekipi hulumtues i Google DeepMind është në një trajektore që mund t’i japë një avantazh. Kompania mori një vendim të hershëm për të ndërtuar Gemini si një aplikacion origjinal multimodal, duke e trajnuar atë jo vetëm në tekst, por në të gjitha multimediat.

Kjo e ngadalësoi Binjakët në fillim, por vendimi po jep rezultat. Lansimi i fundit i Google i Gemini Robotics tregon se si modelet multimodale janë rruga e mundshme drejt arsyetimit më të mirë.

Ekziston një zhanër i tërë i produkteve të konsumit që mund të përfitojnë nga ajo epërsi e hershme në modelet multimodale të AI.

Çipat e inteligjencës artificiale të integruara vertikalisht të Google mund të ndihmojnë në sjelljen më të shpejtë të ideve të produkteve në treg duke ulur kostot e konkluzionit, të cilat deri më tani i kanë bërë disa ide të kushtueshme.