Roboti humanoid i Figure pranon urdhra zanore për të ndihmuar nëpër shtëpi

foto

Themeluesi dhe CEO i Figure, Brett Adcock, zbuloi të enjten një model të ri të mësimit të makinerive për robotët humanoidë. Lajmi, i cili mbërrin dy javë pasi Adcock njoftoi vendimin e firmës së robotikës në Bay Area për t’u larguar nga një bashkëpunim OpenAI, përqendrohet rreth Helix, një model “gjeneralist” Vision-Language-Action (VLA).

foto

VLA-të janë një fenomen i ri për robotikën, duke shfrytëzuar vizionin dhe komandat gjuhësore për të përpunuar informacionin. Aktualisht, shembulli më i njohur i kategorisë është RT-2 i Google DeepMind, i cili trajnon robotët përmes një kombinimi të modeleve video dhe gjuhësore të mëdha (LLM).

foto

Helix punon në një mënyrë të ngjashme, duke kombinuar të dhënat vizuale dhe kërkesat gjuhësore për të kontrolluar një robot në kohë reale. Figura shkruan, “Helix shfaq përgjithësim të fortë të objekteve, duke qenë në gjendje të marrë mijëra sende shtëpiake të reja me forma, madhësi, ngjyra dhe veti materiale të ndryshme që nuk janë hasur kurrë më parë në stërvitje, thjesht duke pyetur në gjuhë natyrale.”

Në një botë ideale, thjesht mund t’i thuash një roboti të bëjë diçka dhe ai thjesht do ta bëjë atë. Këtu hyn Helix, sipas figurës. Platforma është krijuar për të kapërcyer hendekun midis vizionit dhe përpunimit të gjuhës. Pas marrjes së një njoftimi zanor të gjuhës natyrore, roboti vlerëson vizualisht mjedisin e tij dhe më pas kryen detyrën.

Figura ofron shembuj si, “Dorëzo qesen me biskota robotit në të djathtën tënde” ose “Merr qesen me biskota nga roboti në të majtë dhe vendose në sirtarin e hapur”. Të dy këta shembuj përfshijnë një palë robotësh që punojnë së bashku. Kjo është për shkak se Helix është krijuar për të kontrolluar dy robotë në të njëjtën kohë, ku njëri ndihmon tjetrin për të kryer detyra të ndryshme shtëpiake.

Figura po shfaq VLM duke theksuar punën që kompania ka bërë me robotin e saj humanoid 02 në mjedisin e shtëpisë. Shtëpitë janë jashtëzakonisht të ndërlikuara për robotët, duke qenë se atyre u mungon struktura dhe konsistenca e depove dhe fabrikave.

Vështirësia me të mësuarit dhe kontrolli janë pengesat kryesore që qëndrojnë midis sistemeve komplekse të robotëve dhe shtëpisë. Këto çështje, së bashku me etiketat e çmimeve me pesë deri në gjashtë shifra, janë arsyeja pse roboti shtëpiak nuk ka marrë përparësi për shumicën e kompanive të robotikës humanoidë. Në përgjithësi, qasja është të ndërtohen robotë për klientët industrialë, duke përmirësuar besueshmërinë dhe duke ulur kostot përpara se të merren me banesat. Detyrat e shtëpisë janë një bisedë për disa vite nga tani.

Kur TechCrunch vizitoi zyrat e Figure’s Bay Area në 2024, Adcock tregoi disa nga ritmet që po kalonte humanoidi i saj në mjedisin e shtëpisë. Në atë kohë u duk se puna nuk ishte duke u prioritizuar, pasi Figura fokusohet në pilotët e vendeve të punës me korporata si BMW.

Me njoftimin e Helix të së enjtes, Figura po e bën të qartë se shtëpia duhet të jetë një prioritet më vete. Është një mjedis sfidues dhe kompleks për testimin e këtyre llojeve të modeleve të trajnimit. Mësimi i robotëve për të kryer detyra komplekse në kuzhinë – për shembull – i hap ata ndaj një game të gjerë veprimesh në mjedise të ndryshme.

“Që robotët të jenë të dobishëm në familje, ata do të duhet të jenë të aftë të gjenerojnë sjellje të reja inteligjente sipas kërkesës, veçanërisht për objektet që nuk i kanë parë kurrë më parë,” thotë Figura. “Të mësosh robotët qoftë edhe një sjellje të re të vetme kërkon përpjekje të konsiderueshme njerëzore: ose orë programimi manual ekspertësh të nivelit të doktoraturës ose mijëra demonstrime.”

Programimi manual nuk do të përshtatet për shtëpinë. Ka thjesht shumë të panjohura. Kuzhinat, dhomat e ndenjes dhe banjat ndryshojnë në mënyrë dramatike nga njëra në tjetrën. E njëjta gjë mund të thuhet edhe për veglat që përdoren për gatim dhe pastrim. Përveç kësaj, njerëzit lënë rrëmujë, riorganizojnë mobiljet dhe preferojnë një sërë ndriçimesh të ndryshme mjedisore. Kjo metodë kërkon shumë kohë dhe para – megjithëse Figura me siguri ka mjaft nga këto të fundit.

Opsioni tjetër është trajnimi – dhe shumë prej tij. Krahët robotikë të trajnuar për të zgjedhur dhe vendosur objekte në laboratorë shpesh përdorin këtë metodë. Ajo që nuk shihni janë qindra orët e përsëritjes që duhen për ta bërë një demonstrim mjaft të fuqishëm për të marrë përsipër detyra shumë të ndryshueshme. Për të zgjedhur diçka si duhet herën e parë, një robot duhet ta ketë bërë këtë qindra herë në të kaluarën.

Ashtu si shumë robotikë humanoidë përreth për momentin, puna në Helix është ende në një fazë shumë të hershme. Shikuesit duhet të këshillohen se shumë punë ndodh prapa skenave për të krijuar llojet e videove të shkurtra dhe të prodhuara mirë që shihen në këtë postim. Njoftimi i sotëm është, në thelb, një mjet rekrutimi i krijuar për të sjellë më shumë inxhinierë në bord për të ndihmuar në zhvillimin e projektit.