創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人開(kāi)發(fā) > 一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

來(lái)源:CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì)     編輯:創(chuàng)澤   時(shí)間:2020/6/24   主題:其他 [加盟]
1.  研究背景

機(jī)械手內(nèi)操作(in-hand manipulation)是指使用單只機(jī)械手,通過(guò)移動(dòng)手指、手掌等部位來(lái)改變物體在手中的相對(duì)位置和姿態(tài)。這種能力對(duì)于機(jī)器人實(shí)現(xiàn)人類水平的靈巧操作極為重要,因?yàn)樵谌粘I钪杏泻芏囝愃频娜蝿?wù),例如抓取一件工具并調(diào)整它在手中的位置和旋轉(zhuǎn)角度。我們注意到,在實(shí)現(xiàn)復(fù)雜的操作目標(biāo)時(shí),人在操作物體時(shí)常常改變抓取物體的手指接觸點(diǎn)位置,從而極大的提高物體在手中的位姿范圍。

傳統(tǒng)上,手內(nèi)操作有兩類解決方案,一類是基于模型的方法(model-based method),通過(guò)對(duì)抓取的動(dòng)力學(xué)建模,來(lái)控制手指移動(dòng)帶動(dòng)物體姿態(tài)。這種辦法好處在于穩(wěn)定性強(qiáng),模型簡(jiǎn)單,但問(wèn)題在于難以實(shí)現(xiàn)較長(zhǎng)和復(fù)雜的手內(nèi)操作流程,特別是目標(biāo)位姿和起始位姿相距很遠(yuǎn)的情況,因?yàn)樗鼈兒茈y規(guī)劃手指接觸點(diǎn)的移動(dòng);另一類方法是無(wú)模型方法(model-free method),通常使用深度強(qiáng)化學(xué)習(xí)的方法。這類方法優(yōu)點(diǎn)在于不需要系統(tǒng)模型,但缺點(diǎn)在于穩(wěn)定性差,并且需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。而我們的方法結(jié)合了這兩種方法:在底層使用傳統(tǒng)的動(dòng)力學(xué)建模方式保持穩(wěn)定的抓取和實(shí)現(xiàn)簡(jiǎn)單基本的操作單元,在中層通過(guò)深度強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行規(guī)劃,選擇不同的操作單元,最終實(shí)現(xiàn)穩(wěn)定且復(fù)雜的操作流程。我們的方法結(jié)合了兩種方法的優(yōu)點(diǎn):在底層通過(guò)使用基于模型的操作單元,保證了手指與物體之間持續(xù)穩(wěn)定的抓;在中層使用強(qiáng)化學(xué)習(xí)進(jìn)行規(guī)劃,從而實(shí)現(xiàn)較長(zhǎng)和復(fù)雜的手內(nèi)操作流程。

 

2.  研究方法

在底層,我們使用柔性力矩控制器定義了三個(gè)操作單元,分別是reposing,sliding和flipping。Reposing是指在不改變手指與物體接觸點(diǎn)的前提下,通過(guò)控制機(jī)械手改變物體的位姿;sliding是指在不改變物體位姿的前提下,沿著物體滑動(dòng)指尖改變接觸點(diǎn);flipping是指將指頭從一側(cè)移動(dòng)到另一側(cè),從而改變抓握方式。在中層,我們使用深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)在給定目標(biāo)位姿下選擇底層操作單元,最終形成一條由大量不同操作單元組成的序列,實(shí)現(xiàn)復(fù)雜的操作目標(biāo)。






移動(dòng)機(jī)器人Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺(jué)感知相結(jié)合的方法完成非結(jié)構(gòu)環(huán)境下的移動(dòng)

中科院沈陽(yáng)自動(dòng)化所的Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺(jué)感知相結(jié)合的方法來(lái)完成移動(dòng)機(jī)器人在非結(jié)構(gòu)環(huán)境下的移動(dòng)操作

移動(dòng)操作機(jī)器人Centauro通過(guò)融合自身攜帶的多傳感器信息可實(shí)現(xiàn)自主移動(dòng)和抓取操作

德國(guó)伯恩大學(xué)計(jì)算機(jī)學(xué)院研制的遙操作輪腿復(fù)合的移動(dòng)操作機(jī)器人可通過(guò)遠(yuǎn)程操作平臺(tái)完成各種復(fù)雜操作任務(wù)

機(jī)器人手腕的系列分享之一

假肢腕設(shè)計(jì)的有效基準(zhǔn)能夠做3自由度運(yùn)動(dòng),即旋前/旋后、屈伸和橈側(cè)/尺側(cè)偏移,未受影響的腕關(guān)節(jié),其最大活動(dòng)范圍通常在76度/85度

機(jī)器人手腕的系列分享之二

旋轉(zhuǎn)器用于使終端設(shè)備沿前臂的縱向放出或滾動(dòng),而屈肌使終端設(shè)備彎曲或俯仰, OB棘輪式旋轉(zhuǎn)手腕,被動(dòng)腕部裝置的鎖定也可以通過(guò)使用不可反向驅(qū)動(dòng)的機(jī)構(gòu)來(lái)實(shí)現(xiàn)

機(jī)器人手腕的系列分享之二自由度手腕

2自由度腕部由一個(gè)與旋轉(zhuǎn)器串聯(lián)的屈肌單元組成,形成一個(gè)U型關(guān)節(jié)。其中一種設(shè)備是OBRoboWrist ,它可以同時(shí)鎖住前旋和屈曲,當(dāng)解鎖時(shí),還可以通過(guò)轉(zhuǎn)動(dòng)手腕上的項(xiàng)圈來(lái)調(diào)節(jié)運(yùn)動(dòng)產(chǎn)生摩擦阻力

機(jī)器人手腕的系列分享之三自由度手腕

3自由度人工手腕在某些方面優(yōu)于人類的手腕,如運(yùn)動(dòng)范圍或扭矩輸出。盡管一些假肢在設(shè)計(jì)中加入了3自由度手腕,但串行3自由度手腕設(shè)備在機(jī)器人應(yīng)用中更普遍

串行腕關(guān)節(jié)與并行腕關(guān)節(jié)優(yōu)缺點(diǎn)對(duì)比分析

具有相同數(shù)量自由度的設(shè)備之間進(jìn)行比較時(shí),串行機(jī)構(gòu)往往比并行機(jī)構(gòu)更長(zhǎng),對(duì)于串行機(jī)構(gòu),運(yùn)動(dòng)范圍和扭矩規(guī)格通常簡(jiǎn)單地由執(zhí)行機(jī)構(gòu)的選擇和基本形狀幾何決定

假肢腕關(guān)節(jié)和機(jī)器人腕關(guān)節(jié)優(yōu)缺點(diǎn)對(duì)比分析

假肢需要直接的人類互動(dòng)來(lái)發(fā)揮功能,而機(jī)器人手腕則完全是主動(dòng)的,假腕還包括外部可調(diào)節(jié)功能,如可調(diào)節(jié)摩擦或鎖定;機(jī)器人手腕的任何調(diào)整通常都是在控制系統(tǒng)內(nèi)完成的

柔軟的靈巧手的設(shè)計(jì)、制備及驅(qū)動(dòng)

由于軟體材料的發(fā)展,靈巧手也開(kāi)始柔軟起來(lái),如柏林工業(yè)大學(xué)研制的軟體、欠驅(qū)動(dòng)、柔性多指靈巧手、康奈爾大學(xué)研制的軟體多指靈巧手、北京航空航天大學(xué)研制的軟體多指靈巧手

服務(wù)機(jī)器人核心模塊分析

環(huán)境感知技術(shù):機(jī)器人感知環(huán)境及自身狀態(tài)的窗口、運(yùn)動(dòng)控制技術(shù):定位導(dǎo)航與運(yùn)動(dòng)協(xié)調(diào)控制、人機(jī)交互技術(shù):人機(jī)有效溝通的橋梁

LDV激光測(cè)振與3D視覺(jué)傳感在智能機(jī)器人中的應(yīng)用

宋云峰博士分享了LDV激光測(cè)振及3D視覺(jué)傳感技術(shù)在智能機(jī)器人中的應(yīng)用,主要介紹了智能機(jī)器人光學(xué)感知技術(shù)、LDV激光測(cè)振及3D視覺(jué)傳感技術(shù)原理及產(chǎn)品介紹、應(yīng)用案例分享等內(nèi)容

基于主動(dòng)探索的智能抓取機(jī)器人

新型智能抓取機(jī)器人,結(jié)合深度學(xué)習(xí)方法,賦予機(jī)器人主動(dòng)探索感知的能力,解決了Affordance Map缺陷,提高了機(jī)器人在復(fù)雜環(huán)境下的抓取成功率
資料獲取
機(jī)器人開(kāi)發(fā)
== 最新資訊 ==
ChatGPT:又一個(gè)“人形機(jī)器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)方面的政策
中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)聚焦于中國(guó)東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上
諧波減速器和RV減速器比較
機(jī)器人減速器:諧波減速器和RV減速器
人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合
機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面
青島市機(jī)器人產(chǎn)業(yè)概況:機(jī)器人企業(yè)多布局在
六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)
機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人開(kāi)發(fā)平臺(tái)


機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開(kāi)發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728