Studiuesit e MIT dhe Stanford zhvilluan një teknikë të mësimit të makinerive që mund të mësojë në mënyrë efikase të kontrollojë një robot, duke çuar në performancë më të mirë me më pak të dhëna

foto

Studiuesit nga MIT dhe Universiteti Stanford kanë prezantuar një teknikë të re të të mësuarit të makinerive që ka potencialin të revolucionarizojë kontrollin e robotëve, si dronët dhe automjetet autonome, në mjedise dinamike me kushte që ndryshojnë me shpejtësi.

foto

Qasja inovative përfshin parime nga teoria e kontrollit në procesin e mësimit të makinerive, duke lejuar krijimin e kontrollorëve më efikasë dhe efektivë. Studiuesit synuan të mësonin strukturat e brendshme brenda dinamikës së sistemit që mund të shfrytëzoheshin për të hartuar kontrollues të lartë stabilizues.

foto

Në thelb të teknikës është integrimi i strukturave të orientuara nga kontrolli në procesin e të mësuarit model. Duke mësuar së bashku dinamikën e sistemit dhe këto struktura unike të orientuara nga kontrolli nga të dhënat, studiuesit ishin në gjendje të gjeneronin kontrollues që performojnë jashtëzakonisht mirë në skenarët e botës reale.

Ndryshe nga metodat tradicionale të mësimit të makinerive që kërkojnë hapa të veçantë për të nxjerrë ose mësuar kontrollorët, kjo qasje e re nxjerr menjëherë një kontrollues efektiv nga modeli i mësuar. Për më tepër, teknika arrin performancë më të mirë me më pak të dhëna për shkak të përfshirjes së këtyre strukturave të orientuara nga kontrolli, duke e bërë atë veçanërisht të vlefshme në mjediset që ndryshojnë me shpejtësi.

Metoda merr frymëzim nga mënyra se si robotistët përdorin fizikën për të nxjerrë modele më të thjeshta robotësh. Këto modele të nxjerra me dorë kapin marrëdhëniet thelbësore strukturore të bazuara në fizikën e sistemit. Megjithatë, në sistemet komplekse ku modelimi manual bëhet i pamundur, studiuesit shpesh përdorin mësimin e makinerive për të përshtatur një model me të dhënat. Sfida me qasjet ekzistuese është se ato anashkalojnë strukturat e bazuara në kontroll, të cilat janë thelbësore për optimizimin e performancës së kontrolluesit.

Teknika e ekipit të MIT dhe Stanford e trajton këtë kufizim duke përfshirë struktura të orientuara nga kontrolli gjatë mësimit të makinerive. Duke vepruar kështu, ata nxjerrin kontrollues direkt nga modeli i dinamikës së mësuar, duke u martuar në mënyrë efektive me qasjen e frymëzuar nga fizika me mësimin e drejtuar nga të dhënat.

Gjatë testimit, kontrolluesi i ri ndoqi nga afër trajektoret e dëshiruara dhe ia kaloi metodave të ndryshme bazë. Çuditërisht, kontrolluesi i nxjerrë nga modeli i mësuar pothuajse përputhej me performancën e një kontrolluesi të së vërtetës tokësore, i cili është ndërtuar duke përdorur dinamikën e saktë të sistemit.

Teknika ishte gjithashtu shumë efikase për të dhënat, duke arritur performancë të jashtëzakonshme me pika minimale të të dhënave. Në të kundërt, metodat e tjera që përdorën komponentë të shumëfishtë të mësuar pësuan një rënie të shpejtë të performancës me grupe të dhënash më të vogla.

Ky efikasitet i të dhënave është veçanërisht premtues për skenarët ku robotët ose dronët duhet të përshtaten shpejt me kushtet që ndryshojnë me shpejtësi, duke u afruar mirë për aplikimet në botën reale.

Një nga aspektet e rëndësishme të hulumtimit është përgjithësia e tij. Qasja mund të zbatohet në sisteme të ndryshme dinamike, duke përfshirë krahët robotikë dhe anijet kozmike me fluturim të lirë që operojnë në mjedise me gravitet të ulët.

Duke parë përpara, studiuesit janë të interesuar të zhvillojnë modele më të interpretueshme, duke lejuar identifikimin e informacionit specifik rreth një sistemi dinamik. Kjo mund të çojë në kontrollues me performancë edhe më të mirë, duke avancuar më tej fushën e kontrollit jolinear të reagimeve.

Ekspertët e fushës kanë vlerësuar kontributin e këtij hulumtimi, duke theksuar veçanërisht integrimin e strukturave të orientuara nga kontrolli si një paragjykim induktiv në procesin e të mësuarit. Kjo risi konceptuale ka çuar në një proces mësimi shumë efikas, duke rezultuar në modele dinamike me struktura të brendshme të favorshme për kontroll efektiv, të qëndrueshëm dhe të fuqishëm.

Duke inkorporuar struktura të orientuara nga kontrolli gjatë procesit të të mësuarit, kjo teknikë hap mundësi emocionuese për kontrollues më efikas dhe efektiv, duke na sjellë një hap më afër një të ardhmeje ku robotët mund të lundrojnë në skenarë kompleksë me aftësi dhe përshtatshmëri të jashtëzakonshme.