當(dāng)前位置：首頁(yè) > 新聞資訊 > 機(jī)器人開發(fā) > 移動(dòng)機(jī)器人Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺感知相結(jié)合的方法完成非結(jié)構(gòu)環(huán)境下的移動(dòng)

移動(dòng)機(jī)器人Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺感知相結(jié)合的方法完成非結(jié)構(gòu)環(huán)境下的移動(dòng)

來(lái)源：CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì) 編輯：創(chuàng)澤時(shí)間：2020/6/28 主題：其他 [加盟]

中科院沈陽(yáng)自動(dòng)化所的Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺感知相結(jié)合的方法來(lái)完成移動(dòng)機(jī)器人(如圖3(a))在非結(jié)構(gòu)環(huán)境下的移動(dòng)操作[7]。作者將移動(dòng)操作過程看做一個(gè)標(biāo)準(zhǔn)的強(qiáng)化學(xué)習(xí)問題，首先通過雙目相機(jī)通過DOPE獲取目標(biāo)物體的6D姿態(tài)p以及機(jī)器人本體的當(dāng)前狀態(tài)st,接著通過基于PPO的強(qiáng)化學(xué)習(xí)算法預(yù)測(cè)機(jī)器人的本體，機(jī)械臂以及機(jī)械手的運(yùn)動(dòng)并控制機(jī)器人本體運(yùn)動(dòng)，最后機(jī)器人的運(yùn)動(dòng)狀態(tài)st+1和響應(yīng)rt，其中響應(yīng)主要包含了整個(gè)系統(tǒng)的控制響應(yīng)rctrl、機(jī)械手末端的位置響應(yīng)rdist以及抓取狀態(tài)rgrasp(如圖3(b))。最后作者在仿真環(huán)境和真實(shí)環(huán)境下測(cè)試了不同高度下的抓取成功率，在仿真中，立方體的抓取效果最好達(dá)到了90%的成功率，而球類物體較差僅有60%左右，而在實(shí)際測(cè)試過程中，在姿態(tài)估計(jì)正確的前提下可實(shí)現(xiàn)目標(biāo)物體的成功抓取(如圖3(c)(d))。

移動(dòng)機(jī)器人Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺感知相結(jié)合的方法完成非結(jié)構(gòu)環(huán)境下的移動(dòng)

一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

ICRA2020論文分享：基于視觸融合感知的可形變物體抓取狀態(tài)評(píng)估

如何搭建一個(gè)GPU加速的分布式機(jī)器學(xué)習(xí)系統(tǒng)，遇到的問題和解決方法

拯救渣畫質(zhì)，馬賽克圖秒變高清，杜克大學(xué)提出AI新算法

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實(shí)踐

百變應(yīng)用場(chǎng)景下，優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

內(nèi)容流量管理的關(guān)鍵技術(shù)：多任務(wù)保量?jī)?yōu)化算法實(shí)踐

CVPOS自助收銀的挑戰(zhàn)以及商品識(shí)別算法工程落地方法和經(jīng)驗(yàn)

面向動(dòng)態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

人工智能和機(jī)器學(xué)習(xí)之間的差異及其重要性

滴滴機(jī)器學(xué)習(xí)平臺(tái)調(diào)度系統(tǒng)的演進(jìn)與K8s二次開發(fā)

如何更高效地壓縮時(shí)序數(shù)據(jù)？基于深度強(qiáng)化學(xué)習(xí)的探索

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人底盤

移動(dòng)機(jī)器人Wang利用深度強(qiáng)化學(xué)習(xí)算法和視覺感知相結(jié)合的方法完成非結(jié)構(gòu)環(huán)境下的移動(dòng)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人底盤

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)