Manus ndoshta nuk është momenti i dytë ‘DeepSeek’ i Kinës

foto

Manus, një platformë “agjentike” e inteligjencës artificiale që u lançua në pamje paraprake javën e kaluar, po gjeneron më shumë bujë sesa një koncert i Taylor Swift.

Shefi i produktit në Hugging Face e quajti Manus “mjeti më mbresëlënës i AI që kam provuar ndonjëherë”. Studiuesi i politikave të AI, Dean Ball, e përshkroi Manusin si “kompjuterin më të sofistikuar që përdor AI”. Serveri zyrtar Discord për Manus u rrit në mbi 138,000 anëtarë në vetëm pak ditë, dhe kodet e ftesës për Manus thuhet se shiten për mijëra dollarë në aplikacionin kinez të rishitës Xianyu.

Por nuk është e qartë që zhurma është e justifikuar.

Manus nuk u zhvillua tërësisht nga e para. Sipas raporteve në mediat sociale, platforma përdor një kombinim të modeleve ekzistuese dhe të rregulluara të AI, duke përfshirë Claude të Anthropic dhe Qwen të Alibaba, për të kryer detyra të tilla si hartimi i raporteve kërkimore dhe analizimi i dosjeve financiare.

Megjithatë, në faqen e saj të internetit, Butterfly Effect – startup-i kinez pas Manus – jep disa shembuj të egër të asaj që supozohet se mund të arrijë platforma, nga blerja e pasurive të paluajtshme deri te programimi i lojërave video.

Në një video virale në X, Yichao “Peak” Ji, një drejtues kërkimi për Manus, la të kuptohej se platforma ishte superiore ndaj mjeteve agjente si kërkimi i thellë i OpenAI dhe Operatori . Manus e tejkalon kërkimin e thellë në një standard popullor për asistentët e përgjithshëm të AI të quajtur GAIA, pretendoi Ji, i cili heton aftësinë e një AI për të kryer punë duke shfletuar në internet, duke përdorur softuer dhe më shumë.

“[Manus] nuk është thjesht një tjetër chatbot ose rrjedhë pune,” tha Ji në video. “Është një agjent plotësisht autonom që lidh hendekun midis konceptimit dhe ekzekutimit […] Ne e shohim atë si paradigmën e ardhshme të bashkëpunimit njeri-makinë.”

Por disa përdorues të hershëm thonë se Manus nuk është ilaç.

Alexander Doria, bashkëthemeluesi i startup-it të inteligjencës artificiale Pleias, tha në një postim në X se ai hasi mesazhe gabimi dhe sythe të pafund gjatë testimit të Manus. Përdorues të tjerë të X theksuan se Manus bën gabime në pyetje faktike dhe nuk e citon vazhdimisht punën e tij – dhe shpesh humbet informacionin që gjendet lehtësisht në internet.

Përvoja ime me Manus nuk ka qenë tepër pozitive.

I kërkova platformës të trajtonte atë që më dukej si një kërkesë mjaft e drejtpërdrejtë: të porosisni një sanduiç pule të skuqur nga një ushqim i shpejtë me vlerësim më të lartë në gamën time të dërgesave. Pas rreth 10 minutash, Manus u rrëzua. Në përpjekjen e dytë, ai gjeti një artikull të menysë që plotësonte kriteret e mia, por Manus nuk mundi të përfundonte procesin e porositjes – ose të siguronte një lidhje për arkëtimin, madje.

foto

Manus u ndje në mënyrë të ngjashme kur i kërkova të rezervonte një fluturim nga NYC në Japoni. Duke marrë udhëzime që mendova se nuk linin shumë hapësirë ​​për paqartësi (p.sh. “kërkoni një fluturim të klasit të biznesit, duke i dhënë përparësi çmimit dhe datat fleksibël”), më e mira që mund të bënte Manus ishte të ofronte lidhje me tarifat në disa faqe interneti të linjave ajrore dhe motorë kërkimi të biletave ajrore si Kayak, disa prej të cilave ishin të prishura.

foto

Duke shpresuar se detyrat e ardhshme mund të jenë hijeshi, i thashë Manus të rezervonte një tavolinë për një në një restorant në distancë në këmbë. Dështoi pas disa minutash. Pastaj i kërkova platformës të ndërtonte një lojë luftarake të frymëzuar nga Naruto. Doli gabim pas gjysmë ore, që ishte koha kur vendosa ta heq peshqir.

Një zëdhënës i Manus i dërgoi TechCrunch deklaratën e mëposhtme përmes DM:

“Si një ekip i vogël, fokusi ynë është të vazhdojmë të përmirësojmë Manus dhe të krijojmë agjentë të AI që në fakt i ndihmojnë përdoruesit të zgjidhin problemet […] Qëllimi kryesor i beta-së aktuale të mbyllur është të testojë stresin e pjesëve të ndryshme të sistemit dhe të identifikojë problemet. Ne vlerësojmë thellësisht njohuritë e vlefshme të ndara nga të gjithë.”

Pra, nëse Manus nuk i përmbush premtimet e tij teknike, pse shpërtheu? Disa faktorë kontribuan, si ekskluziviteti i krijuar nga mungesa e ftesave.

Mediat kineze nxituan ta shpallnin Manusin si një zbulim të inteligjencës artificiale; botimi QQ News e quajti atë “krenaria e produkteve vendase”. Ndërkohë, influencuesit e AI në mediat sociale përhapin dezinformata rreth aftësive të Manus. Një video e shpërndarë gjerësisht tregoi një program desktopi, gjoja Manus, duke ndërmarrë veprime nëpër aplikacione të shumta smartphone. Ji konfirmoi se video nuk ishte, në fakt, një demo e Manus.

Llogari të tjera me ndikim të AI në X kërkuan të bënin krahasime midis Manus dhe kompanisë kineze të AI DeepSeek – krahasime jo domosdoshmërisht të rrënjosura në fakt. Butterfly Effect nuk zhvilloi modele në shtëpi, ndryshe nga DeepSeek. Dhe ndërsa DeepSeek bëri shumë nga teknologjitë e tij të disponueshme hapur, Butterfly Effect nuk e ka bërë – të paktën jo ende.

Për të qenë i drejtë me Butterfly Effect, Manus është në hyrje të hershme. Kompania pretendon se po punon për të shkallëzuar kapacitetin kompjuterik dhe për të rregulluar problemet siç raportohen. Por meqenëse platforma ekziston aktualisht, Manus duket të jetë një rast i zhurmës që shkon përpara inovacionit teknologjik.