Algoritmi i çon robotët një hap më afër aftësisë për të vepruar sipas intuitës

foto

Studiuesit nga Universiteti i Hertfordshire kanë zhvilluar një algoritëm të ri që do t’i lejojë robotët të funksionojnë më intuitivisht domethënë të marrin vendime duke përdorur mjedisin e tyre për udhëzim.

foto

Parimi është që, nëpërmjet algoritmit, agjenti robot krijon qëllimet e veta.

foto

Për herë të parë, algoritmi unifikon qasje të ndryshme të përcaktimit të qëllimeve nën një koncept që lidhet drejtpërdrejt me fizikën, dhe për më tepër e bën këtë llogaritje transparente në mënyrë që të tjerët të mund ta studiojnë dhe ta adoptojnë atë.

Parimi i algoritmit lidhet me teorinë e famshme të kaosit, sepse metoda e bën agjentin “mjeshtër të kaosit të dinamikës së sistemit”.

Studimi është publikuar në revistën PRX Life. Studiuesit e Herts eksploruan “modele të motivimit” të robotëve që imitojnë proceset e vendimmarrjes së njerëzve dhe kafshëve, edhe në mungesë të sinjaleve të qarta shpërblimi.

Studimi prezanton formulat e inteligjencës artificiale (AI) që llogaritin një mënyrë për një robot për të vendosur veprimet e ardhshme pa udhëzime të drejtpërdrejta ose kontribut njerëzor.

Daniel Polani, profesor i Shkencave Kompjuterike dhe autor i vjetër shpjegon, “Në një kuptim të aplikuar, ajo që mund të nënkuptojë, për shembull, është të detyrosh një robot të luajë dhe të manipulojë vetë objektet pa iu thënë ta bëjë këtë.

“Kjo mund të përmirësojë mënyrën se si robotët mësojnë të ndërveprojnë si me njerëzit ashtu edhe me robotët e tjerë duke inkurajuar sjellje dhe ndërveprime më ‘natyrore’.

“Kjo ka aplikime të mëtejshme – të tilla si sjellja e mbijetesës së robotëve gjysmëautonomë të vendosur në situata ku ata janë të paarritshëm nga një operator njerëzor, si në vende nëntokësore ose ndërplanetare.”

Tek njerëzit dhe kafshët, një teori supozon ekzistencën e një “motivimi të brendshëm”, ku sjelljet drejtohen vetëm nga ndërveprimi midis qenies dhe mjedisit të tij dhe jo nga shpërblimet specifike të mësuara, siç është ushqimi. Ky punim e përkthen me sukses atë teori të “motivimit të brendshëm” në një teori që mund të përdoret nga agjentët robotikë.

Profesor Polani shton, “Kjo punë është emocionuese sepse ne tani mund të zbatojmë një mekanizëm, të ngjashëm me ata që ndihmojnë njerëzit dhe kafshët të zgjidhin probleme të reja pa përvojë paraprake, në robotë.

“Ne presim që ne të mund të ndërtojmë mbi këtë punë për të zhvilluar më shumë robotë të ngjashëm me njeriun në të ardhmen me procese më intuitive. Kjo hap një mundësi të madhe për robotë më të sofistikuar me procese vendimesh të ngjashme me ne.”

Teoria që qëndron në themel të këtij punimi, e quajtur “maksimizimi i fuqizimit”, është zhvilluar në Herts për shumë vite. Ai sugjeron që duke rritur gamën e rezultateve të ardhshme, një robot do të ketë opsione më të mira edhe në të ardhmen më të gjatë. E rëndësishmja, kjo metodë zëvendëson dhe kështu mundësisht shmang sistemet tradicionale të shpërblimit (p.sh. sinjalet e ushqimit).

Ndërsa maksimizimi i fuqizimit ka treguar premtues, ai ende nuk është kuptuar plotësisht ose zbatohet gjerësisht. Shumica e studimeve mbështeteshin në simulime, ndërsa llogaritja e përpiktë e informacionit të nevojshëm për sistemet komplekse dhe teoria mbetet sfiduese.

Megjithatë, ky hulumtim i fundit inovativ synon të shpjegojë pse motivimet e bazuara në fuqizim mund të krijojnë sjellje të ngjashme me ato të organizmave të gjallë, duke çuar potencialisht në robotë më të motivuar; dhe gjithashtu ofron një mënyrë të përmirësuar dukshëm për llogaritjen e këtyre motivimeve.

Profesor Polani thotë se hapat e ardhshëm janë përdorimi i këtij algoritmi përparimtar për të lejuar robotët të zbulojnë më shumë rreth botës, duke zhvilluar mësimin e drejtpërdrejtë dhe identifikimin dhe përmirësimin e aftësive të reja që do të nxisin vlerën e tyre në skenarët e botës reale.