Amazon planifikon të rilançojë Alexa-n si një agjent i AI

foto

Amazon është duke u përgatitur për të rilançuar asistentin e tij dixhital të fuqizuar me zë Alexa si një “agjent” i inteligjencës artificiale që mund të kryejë detyra praktike, ndërsa grupi i teknologjisë garon për të zgjidhur sfidat që kanë ndikuar në rinovimin e AI të sistemit.

foto

Kompania prej 2.4 trilion dollarësh ka kërkuar për dy vitet e fundit të ridizajnojë Alexa-n, sistemin e saj bisedor të ngulitur brenda 500 milionë pajisjeve të konsumatorit në mbarë botën, kështu që “truri” i softuerit transplantohet me AI gjeneruese.

foto

Rohit Prasad, i cili drejton ekipin e inteligjencës së përgjithshme artificiale (AGI) në Amazon, tha për Financial Times se asistenti zanor ende kishte nevojë për të kapërcyer disa pengesa teknike përpara prezantimit.

Kjo përfshin zgjidhjen e problemit të “halucinacioneve” ose përgjigjeve të sajuara, shpejtësinë e përgjigjes ose “latencën” e tij dhe besueshmërinë. “Halucinacionet duhet të jenë afër zeros,” tha Prasad. “Është ende një problem i hapur në industri, por ne po punojmë jashtëzakonisht shumë për të.”

Vizioni i drejtuesve të Amazon është të transformojnë Alexa, e cila aktualisht përdoret ende për një grup të ngushtë detyrash të thjeshta, si luajtja e muzikës dhe vendosja e alarmeve, në një produkt “agjent” që vepron si një portier i personalizuar. Kjo mund të përfshijë çdo gjë nga sugjerimi i restoranteve deri te konfigurimi i dritave në dhomën e gjumit bazuar në ciklet e gjumit të një personi.

Ridizajnimi i Alexa ka qenë në trajnim që nga fillimi i ChatGPT i OpenAI, i mbështetur nga Microsoft, në fund të vitit 2022. Ndërsa Microsoft, Google, Meta dhe të tjerë kanë futur shpejt AI gjeneruese në platformat e tyre kompjuterike dhe kanë përmirësuar shërbimet e tyre softuerike, kritikët kanë vënë në dyshim nëse Amazon mund të zgjidhë në kohë betejat e saj teknike dhe organizative për të konkurruar me rivalët e saj.

Sipas punonjësve të shumtë që kanë punuar në ekipet e asistentëve zanorë të Amazon në vitet e fundit, përpjekja e saj është shoqëruar me komplikime dhe pason vite të tëra kërkimi dhe zhvillimi të AI.

Disa ish-punonjës thanë se pritja e gjatë për një prezantim ishte kryesisht për shkak të vështirësive të papritura të përfshira në ndërrimin dhe kombinimin e algoritmeve më të thjeshta, të paracaktuara mbi të cilat ishte ndërtuar Alexa, me modele të mëdha gjuhësore më të fuqishme por të paparashikueshme.

Në përgjigje, Amazon tha se “po punonte shumë për të mundësuar ndihmë edhe më proaktive dhe më të aftë” të asistentit të saj zanor. Ai shtoi se një zbatim teknik i kësaj shkalle, në një shërbim të drejtpërdrejtë dhe një grup pajisjesh të përdorura nga klientët në mbarë botën, ishte i paprecedentë dhe jo aq i thjeshtë sa të mbivendosësh një LLM në shërbimin Alexa.

Prasad, ish-arkitekti kryesor i Alexa, tha se lëshimi i muajit të kaluar i modeleve të brendshme të kompanisë Amazon Nova – të udhëhequr nga ekipi i tij AGI – ishte pjesërisht i motivuar nga nevojat specifike për shpejtësinë, koston dhe besueshmërinë optimale, në mënyrë që të ndihmonte Aplikacionet e inteligjencës artificiale si Alexa “arrin në atë milje të fundit, që është vërtet e vështirë”.

Për të vepruar si agjent, “truri” i Alexa duhet të jetë në gjendje të telefonojë qindra softuer dhe shërbime të palëve të treta, tha Prasad.

“Ndonjëherë ne nënvlerësojmë se sa shërbime janë integruar në Alexa dhe është një numër masiv. Këto aplikacione marrin miliarda kërkesa në javë, kështu që kur përpiqeni të bëni veprime të besueshme të ndodhin me shpejtësi… ju duhet të jeni në gjendje ta bëni atë në një mënyrë shumë me kosto efektive,” shtoi ai.

Kompleksiteti vjen nga përdoruesit e Alexa që presin përgjigje të shpejta si dhe nivele jashtëzakonisht të larta saktësie. Cilësi të tilla janë në kundërshtim me natyrën e natyrshme probabiliste të AI-së gjeneruese të sotme, një softuer statistikor që parashikon fjalë bazuar në modelet e të folurit dhe gjuhës.

Disa ish-staf gjithashtu theksojnë vështirësitë për të ruajtur atributet origjinale të asistentit, duke përfshirë qëndrueshmërinë dhe funksionalitetin e tij, duke e mbushur atë me veçori të reja gjeneruese si kreativiteti dhe dialogu i rrjedhshëm.

Për shkak të natyrës më të personalizuar dhe të zhurmshme të LLM-ve, kompania gjithashtu planifikon të punësojë ekspertë për të formësuar personalitetin, zërin dhe diksionin e AI-së në mënyrë që të mbetet e njohur për përdoruesit e Alexa, sipas një personi të njohur me këtë çështje.

Një ish-anëtar i lartë i ekipit Alexa tha se ndërsa LLM-të ishin shumë të sofistikuara, ato vijnë me rreziqe, të tilla si prodhimi i përgjigjeve që janë “plotësisht të shpikura disa herë”.

“Në shkallën që operon Amazon, kjo mund të ndodhë shumë herë në ditë,” thanë ata, duke dëmtuar markën dhe reputacionin e saj.

Në qershor, Mihail Eric, një ish-shkencëtar i mësimit të makinerive në Alexa dhe anëtar themelues i “ekipit të saj të modelimit bashkëbisedues”, tha publikisht se Amazon “e kishte hequr dorë” duke u bërë “lideri i qartë i tregut në AI bisedore” me Alexa.

Eric tha se pavarësisht se kishte talent të fortë shkencor dhe burime “të mëdha” financiare, kompania ishte “mbushur me probleme teknike dhe burokratike”, duke sugjeruar se “të dhënat ishin të shënuara dobët” dhe “dokumentacioni ishte ose inekzistent ose i ndenjur”.

Sipas dy ish-punonjësve që punonin në inteligjencën artificiale të lidhur me Alexa-n, teknologjia historike në bazë të asistentit zanor kishte qenë jofleksibile dhe e vështirë për t’u ndryshuar shpejt, e rënduar nga një bazë kodi e ngathët dhe e çorganizuar dhe një ekip inxhinierik “i përhapur shumë i hollë”.

Softueri origjinal Alexa, i ndërtuar mbi teknologjinë e fituar nga start-up-i britanik Evi në 2012, ishte një makinë përgjigjeje pyetjesh që funksiononte duke kërkuar brenda një universi të përcaktuar faktesh për të gjetur përgjigjen e duhur, si moti i ditës ose një specifikë specifike. këngë në bibliotekën tuaj muzikore.

Alexa e re përdor një tufë me modele të ndryshme të AI për të njohur dhe përkthyer pyetje zanore dhe për të gjeneruar përgjigje, si dhe për të identifikuar shkeljet e politikave, të tilla si marrja e përgjigjeve të papërshtatshme dhe halucinacioneve. Ndërtimi i softuerit për të përkthyer midis sistemeve të vjetra dhe modeleve të reja të AI ka qenë një pengesë kryesore në integrimin Alexa-LLM.

Modelet përfshijnë softuerin e brendshëm të Amazon, duke përfshirë modelet më të fundit Nova, si dhe Claude, modelin e AI nga start-up Anthropic, në të cilin Amazon ka investuar 8 miliardë dollarë gjatë 18 muajve të fundit.

“Gjëja më sfiduese në lidhje me agjentët e AI është të sigurohet që ata të jenë të sigurt, të besueshëm dhe të parashikueshëm”, tha shefi ekzekutiv i Anthropic, Dario Amodei, për FT vitin e kaluar.

Softueri i inteligjencës artificiale të ngjashme me agjentët duhet të arrijë në pikën “ku… njerëzit në të vërtetë mund të kenë besim në sistem”, shtoi ai. “Sapo të arrijmë në atë pikë, atëherë ne do t’i lëshojmë këto sisteme.”

Një punonjës aktual tha se nevojiteshin akoma më shumë hapa, të tilla si mbivendosja e filtrave të sigurisë së fëmijëve dhe testimi i integrimeve të personalizuara me Alexa si dritat inteligjente dhe zilja e derës Ring.

“Besueshmëria është çështja – ta bësh atë të punojë afër 100 për qind të kohës,” shtoi punonjësi. “Kjo është arsyeja pse na shihni ne… ose Apple ose Google duke transportuar ngadalë dhe në rritje.”

Shumë palë të treta që zhvillojnë “aftësi” ose veçori për Alexa thanë se nuk ishin të sigurt se kur do të dilte pajisja e re gjeneruese e aktivizuar me AI dhe si të krijonin funksione të reja për të.

“Ne jemi duke pritur për detajet dhe mirëkuptimin,” tha Thomas Lindgren, bashkëthemelues i zhvilluesit suedez të përmbajtjes Wanderword. “Kur filluam të punonim me ta, ata ishin shumë më të hapur… më pas me kalimin e kohës, ata kanë ndryshuar.”

Një partner tjetër tha se pas një periudhe fillestare “presioni” që iu bë zhvilluesve nga Amazon për të filluar përgatitjen për gjeneratën e ardhshme të Alexa, gjërat kishin shkuar në qetësi.

Një sfidë e qëndrueshme për ekipin Alexa të Amazon – i cili u godit nga pushime të mëdha nga puna në 2023 – është se si të fitosh para. Të kuptosh se si t’i bëjmë asistentët “mjaft të lirë për të kandiduar në shkallë” do të jetë një detyrë e madhe, tha Jared Roesch, bashkëthemelues i grupit gjenerues të AI OctoAI.

Opsionet që po diskutohen përfshijnë krijimin e një shërbimi të ri abonimi Alexa, ose për të marrë një ulje të shitjeve të mallrave dhe shërbimeve, tha një ish-punonjës i Alexa.

Prasad tha se qëllimi i Amazon ishte të krijonte një shumëllojshmëri modelesh të AI që mund të vepronin si “blloqe ndërtimi” për një sërë aplikacionesh përtej Alexa.

“Ajo në të cilën ne jemi gjithmonë të bazuar janë klientët dhe AI ​​praktike, ne nuk po bëjmë shkencë për hir të shkencës”, tha Prasad. “Ne po e bëjmë këtë për të dhënë vlerën dhe ndikimin e klientit, i cili në këtë epokë të AI gjeneruese po bëhet më i rëndësishëm se kurrë, sepse klientët duan të shohin një kthim nga investimi.”