CEO i Perplexity flet për sfidën ndaj Google dhe luftën e ardhshme të shfletuesve me AI

foto

Aravind Srinivas po lufton me Google për të instaluar paraprakisht asistentin e tij të AI në Perplexity në telefonat Android. Në të njëjtën kohë, CEO po ripërqendron startup-in e tij në atë që ai parashikon se do të jetë fusha e ardhshme e betejës në garën e AI: shfletuesi juaj i internetit.

foto

Perplexity planifikon të lëshojë shfletuesin e vet të quajtur Comet muajin e ardhshëm, më thotë Srinivas. “Arsyeja që ne po bëjmë shfletuesin është se mund të jetë mënyra më e mirë për të ndërtuar agjentë,” thotë ai. “Një shfletues është në thelb një sistem operativ me kontejnerë. Ai mund t’ju lejojë të aksesoni shërbime të tjera të palëve të treta përmes skedave të fshehura nëse jeni identifikuar tashmë në to, të gërvishtni faqen në anën e klientit dhe të kryeni arsyetimin dhe të ndërmerrni veprime në emrin tuaj.”

foto

Firma të tjera të AI tashmë po shkojnë në këtë drejtim. Operatori i OpenAI dhe Mariner i Google mbështeten të dy në shfletuesin për të ekzekutuar komanda dhe për të kontrolluar faqet e internetit. OpenAI ende nuk ka lëshuar shfletuesin e vet, por thuhet se është duke e zhvilluar një të tillë. Google, ndërkohë, mund të detyrohet nga qeveria amerikane të shesë Chrome pas vendimit të saj se kompania ka një monopol në tregun e kërkimit.

Një nga deputetët e Srinivas dëshmoi se Perplexity do të donte të drejtonte Chrome nëse do të dilte nga Google, ndërkohë që OpenAI ka hedhur gjithashtu kapelën e tij në ring. (Mos llogarit edhe Yahoo-në, mendoj?)

Ndërsa fati i Chrome mbetet i panjohur, kontrolli antitrust në Google ka krijuar tashmë një mundësi që Perplexity të hyjë në marrëveshje shpërndarjeje me prodhuesit e telefonave Android. Këtë javë, Motorola njoftoi se Perplexity do të instalohej paraprakisht në telefonat e saj të rinj Razr, duke i dhënë “motorit të përgjigjeve” të vetë-përshkruar me AI të Srinivas qasje në miliona klientë të tjerë. Ai thotë se nuk është një integrim aq i thellë sa dëshironte ai ose Motorola, por për një startup më të vogël si Perplexity, ai ende e sheh atë si një fitore.

“Nëse Google nuk do të kishte kaluar testin e DOJ-së, ne nuk do të kishim qenë në gjendje ta realizonim këtë partneritet,” thotë ai. “Ata do të kishin ngacmuar shumë OEM. Unë kam pasur biseda me telekomandë ku ata as nuk do të na dëgjonin ose nuk do të bënin takime me ne për shkak të frikës se nëse Mountain View vihet në dijeni, pjesa e tyre e të ardhurave mund të reduktohet.”

Kur fola për herë të fundit me Srinivas pak më shumë se një vit më parë, Perplexity kishte rreth 1 milion përdorues dhe kishte mbledhur më pak se 100 milion dollarë. Tani, startup-i ka afro 30 milionë përdorues aktivë mujorë dhe ka mbledhur qindra milionë dollarë. Srinivas thotë se Perplexity aktualisht po shërben rreth 600 milionë pyetje në muaj, që është afërsisht 14 për qind e vëllimit të pyetjeve të Google.

Biseda e mëposhtme me Srinivas u zhvillua një ditë para njoftimit të tij me Motorola. Ne mbuluam llojet e tjera të partneriteteve që ai po eksploron për të zgjeruar shtrirjen e Perplexity, pse ai po vë bast në zotërimin e ndërfaqes së shfletuesit, si arriti të ndërtojë një asistent iOS që kontrollon aplikacionet e tjera, bisedat e tij rreth ekzekutimit të TikTok dhe më shumë.

Biseda e mëposhtme është redaktuar për gjatësi dhe qartësi:

Më tregoni se si lindi partneriteti Motorola dhe sfidat me të cilat u përballët me Google.

Bisedat u përshpejtuan kur u treguam atyre një demonstrim të asistentit Android Perplexity, i cili u lançua në janar . Ata e provuan atë dhe po funksiononte mjaft të besueshme – shumë më mirë se Binjakët. Ata u emocionuan për ngarkimin paraprak të aplikacionit dhe njoftimin e përdoruesve për ta bërë Preplexity asistentin e paracaktuar. Google i ndaloi ata duke thënë se nuk mund të vazhdojnë me lançimin e telefonit duke përdorur Play Store dhe versionin zyrtar të Android nëse nuk e kanë Gemini si sistemin e paracaktuar.

Nëse Google nuk do të kishte kaluar testin e DOJ, ne nuk do të kishim qenë në gjendje ta realizonim këtë partneritet. Ata do të kishin ngacmuar shumë OEM. Unë kam pasur biseda me telekomandë ku ata as nuk do të na dëgjonin ose nuk do të bënin takime me ne për shkak të frikës se nëse Mountain View ndërgjegjësohej, pjesa e tyre e të ardhurave mund të reduktohej.

Duhen shtatë ose tetë klikime për të ndryshuar parazgjedhjen. Google ka ende një kontroll të fortë në ekosistemin Android.

Samsung ka investuar tek ju. Do të kishte kuptim që kjo të çonte në një lloj partneriteti, si ai që shpallët me Motorola, apo jo?

Po. Shpresoj se mund të gjejmë një mënyrë për të punuar me ta. Nuk e di se kush do të marrë parazgjedhjen, ose nëse do të jetë një hap i hyrjes. E gjithë kjo është për debat.

Duket sikur jeni shumë i fokusuar në shpërndarjen dhe partneritetet për rritjen e Perplexity.

Ne duam të punojmë me këdo. Ne kemi punuar tashmë me telekomandë. Ne duam të zgjerohemi në OEM. Tjetra do të jetë një shfletues dhe ne do të kemi versione të tij për Mac dhe Windows. Ne do të përpiqemi të fillojmë të punojmë me OEM gjithashtu atje.

Ngjashëm me mënyrën se si Google i ka të gjitha marrëdhëniet e tij me OEM në Android, Microsoft ka kontrata edhe më të këqija me OEM në laptopë. Pra, ne duhet ta luftojmë atë betejë të vështirë edhe atje. Duhet të jemi të zgjuar dhe të luftojmë. Do të ishte shumë e vështirë të gjesh njerëz që në mënyrë objektive do të thonë se Copilot është një produkt më i mirë se Perplexity, por Copilot është e vetmja AI që ngarkohet në mënyrë origjinale në Windows.

Sapo keni lëshuar asistentin tuaj në iOS dhe njerëzit duken të habitur me atë që mund të bëjë. A ju dha Apple leje speciale për të kontrolluar aplikacionet e tjera?

Nuk na dhanë leje. Ju nuk mund ta përdorni sistemin tonë për të vendosur një alarm, për të aktivizuar modalitetin me energji të ulët, për të rregulluar ndriçimin ose volumin, ose për të ndezur dhe fikur elektrik dore. Ju nuk mund të bëni një telefonatë ose të dërgoni një iMessage.

Ne vendosëm të përdorim Apple EventKit SDK sepse ekspozon Përkujtuesit, Podcast-et, Apple Music, Apple Maps dhe disa aplikacione të tjera të Apple. Ne jemi në gjendje ta quajmë atë [SDK] dhe të përdorim infrastrukturën tonë të kërkimit dhe lidhjen e thellë me aplikacione si YouTube dhe Uber.

Të gjithë thonë se Siri nuk funksionon, por Siri funksionon vetëm për vendosjen e alarmeve dhe kryerjen e telefonatave, apo jo? Aty ku Siri nuk funksionon është gjetja e këngës së duhur, gjetja e podkasteve dhe videove në YouTube, vendosja e kujtuesve inteligjentë dhe përshëndetja e udhëtimeve në Uber. Unë mendoj se ne i kemi gozhduar të gjitha ato raste përdorimi.

Pse po bëni një shfletues? Dhe kur vjen?

Arsyeja që po bëjmë shfletuesin është se mund të jetë mënyra më e mirë për të ndërtuar agjentë. Si në iOS ashtu edhe në Android, ne nuk kemi kontroll të nivelit të OS. Nuk mund të telefononi lehtësisht aplikacione dhe të përdorni informacionin e tyre. Ju mund të lidheni thellë me to, por për shembull, me Uber, unë nuk mund të shkoj dhe të kontrolloj çmimet e udhëtimeve të ndryshme të Uber dhe t’ju ofroj Comfort nëse nuk ka shumë diferencë çmimi. Unë nuk mund të krahasoj çmimet midis Uber dhe Lyft për të marrë udhëtimin më të mirë. Nuk mund të krahasoj kohët e pritjes midis Uber Eats dhe DoorDash për të marrë atë që është optimale.

Pra, ne duhet të ndërtojmë një agjent të nivelit OS, dhe një shfletues është në thelb një sistem operativ i kontejneruar. Mund t’ju lejojë të përdorni shërbime të tjera të palëve të treta përmes skedave të fshehura nëse tashmë jeni identifikuar në to, të gërvishtni faqen në anën e klientit dhe të kryeni arsyetimin dhe të ndërmerrni veprime në emrin tuaj. Kjo është arkitektura që na tërheq neve.

Përgjigja e pyetjeve do të jetë një mall. Ne duhet të ndërtojmë grupin tonë të ardhshëm të avantazheve në kryerjen e veprimeve. Kjo është arsyeja pse ne po ndërtojmë një shfletues. Shfletuesi është vendi më i mirë për të ndërmarrë veprime për njerëzit. Ne duam të kalojmë në një front-end tjetër.

Shumë botues janë mërzitur me ju për gërvishtjen e përmbajtjes së tyre. Ju keni filluar të shkurtoni disa prej tyre çeqe. A ndiheni sikur jeni në një vend të mirë me botuesit tani, apo mendoni se ka akoma më shumë punë për të bërë?

Jam i sigurt se ka më shumë punë për të bërë, por është në një farë mënyre vend më i mirë se sa ishte hera e fundit që folëm. Ne po gërvishtim por respektojmë robots.txt. Ne përdorim vetëm ofrues të të dhënave të palëve të treta për çdo gjë që nuk na lejon të gërvishtim.

Ju thuhet se po grumbulloni qindra miliona dollarë me një vlerësim prej 18 miliardë dollarësh. Si do t’i përdorni ato para?

Për të ndërtuar agjentë në mënyrë të besueshme, duhet të përdorni modelet e arsyetimit kufitar. Çfarëdo që është e shtrenjtë sot do të bëhet vërtet e lirë një vit nga tani, por ne nuk mund të presim deri atëherë. Ne duhet ta shpërndajmë këtë për sa më shumë përdorues të jetë e mundur për të mbledhur të gjitha të dhënat, për t’i distiluar ato në modele më të vogla dhe për të ulur koston.

Cili është statusi i ofertës suaj për TikTok ? A keni folur me Shtëpinë e Bardhë kohët e fundit? Kishte pyetje se si do ta financonit.

Nuk kam hequr dorë nga kjo, por do të thoja se nuk është se kam pasur goditjen më të mirë. Unë mendoj se të gjithë e dinin këtë. Nuk mendoj se çështja është [financimi]. Kishte mjaft mbështetës që donin të më mbështesnin.

Ajo që dëgjuam nga njerëzit e ByteDance nuk ishte as një çështje e lidhur me financimin. Është më shumë gatishmëria për të vazhduar kontrollin e algoritmit. Unë mendoj se ata duan të ruajnë pronësinë dhe kontrollin e tij dhe besojnë se askush tjetër nuk mund ta bëjë atë aq mirë sa ata munden. Aplikacioni që funksionon në Amerikë dhe Evropë është gjithashtu shumë i lidhur së bashku. Është shumë e vështirë ta shkëputësh atë. Tarifat do të kontrollojnë gjithçka, përfshirë TikTok.

A shqetësoheni për shkallën e ChatGPT dhe se është mjaft e mirë për shumë njerëz që tani nuk do ta provojnë Perplexity? ChatGPT po krijon gjithashtu kyçje të përdoruesit duke kujtuar gjërat dhe duke u bërë më i personalizuar.

Unë mendoj se strategjia e tyre, të paktën bazuar në atë që Sam Altman tha në intervistën e Ben Thompson , është të vendosin një buton “Hyrja me ChatGPT” në aplikacionet e palëve të treta dhe më pas ta përdorin atë për të gëlltitur të gjitha të dhënat në ChatGPT. Por kjo kërkon të bindni të gjitha aplikacionet e palëve të treta për të vendosur një opsion “Hyrja me ChatGPT”.

Strategjia jonë është t’i lejojmë njerëzit të qëndrojnë të kyçur aty ku janë. Ne do të ndërtojmë një shfletues dhe në këtë mënyrë do të aksesojmë aplikacionet në emër të përdoruesit në anën e klientit.

Mendoj se kujtesa do të fitohet nga kompania që ka më shumë kontekst. ChatGPT nuk di asgjë për atë që blini në Instagram ose Amazon. Gjithashtu nuk di asgjë për sa kohë shpenzoni në uebsajte të ndryshme. Ju duhet t’i keni të gjitha këto të dhëna për t’i personalizuar thellësisht për përdoruesin. Nuk ka të bëjë me atë se kush hap memorien bazuar në rikthimin e pyetjeve të kaluara. Është shumë e thjeshtë për t’u përsëritur.

Ajo që është e vështirë është të importoni transaksionet tuaja, tregtinë tuaj, historinë tuaj dhe të gjitha gjërat në shfletuesin tuaj, në asistentin tuaj në një mënyrë ndër-platformë. Kjo është arsyeja pse ne duhet jo vetëm të ndërtojmë një shfletues në ueb, por edhe në celular, dhe të ndajmë kukit në të gjitha aplikacionet. Kjo është sfida.

Duket sikur e shihni se shfletuesi është kufiri përfundimtar për atë që po ndërtoni.

Ka më shumë përtej kësaj, që është ndërtimi i Windows, Mac, Android ose iOS. Një shfletues është shumë i kufizuar dhe i kontejneruar. OS është loja më e mirë.