首頁(yè)
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人開(kāi)發(fā) > 一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作  
 

一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

來(lái)源:CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì)      編輯:創(chuàng)澤      時(shí)間:2020/6/24      主題:其他   [加盟]
1.  研究背景

機(jī)械手內(nèi)操作(in-hand manipulation)是指使用單只機(jī)械手,通過(guò)移動(dòng)手指、手掌等部位來(lái)改變物體在手中的相對(duì)位置和姿態(tài)。這種能力對(duì)于機(jī)器人實(shí)現(xiàn)人類水平的靈巧操作極為重要,因?yàn)樵谌粘I钪杏泻芏囝愃频娜蝿?wù),例如抓取一件工具并調(diào)整它在手中的位置和旋轉(zhuǎn)角度。我們注意到,在實(shí)現(xiàn)復(fù)雜的操作目標(biāo)時(shí),人在操作物體時(shí)常常改變抓取物體的手指接觸點(diǎn)位置,從而極大的提高物體在手中的位姿范圍。

傳統(tǒng)上,手內(nèi)操作有兩類解決方案,一類是基于模型的方法(model-based method),通過(guò)對(duì)抓取的動(dòng)力學(xué)建模,來(lái)控制手指移動(dòng)帶動(dòng)物體姿態(tài)。這種辦法好處在于穩(wěn)定性強(qiáng),模型簡(jiǎn)單,但問(wèn)題在于難以實(shí)現(xiàn)較長(zhǎng)和復(fù)雜的手內(nèi)操作流程,特別是目標(biāo)位姿和起始位姿相距很遠(yuǎn)的情況,因?yàn)樗鼈兒茈y規(guī)劃手指接觸點(diǎn)的移動(dòng);另一類方法是無(wú)模型方法(model-free method),通常使用深度強(qiáng)化學(xué)習(xí)的方法。這類方法優(yōu)點(diǎn)在于不需要系統(tǒng)模型,但缺點(diǎn)在于穩(wěn)定性差,并且需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。而我們的方法結(jié)合了這兩種方法:在底層使用傳統(tǒng)的動(dòng)力學(xué)建模方式保持穩(wěn)定的抓取和實(shí)現(xiàn)簡(jiǎn)單基本的操作單元,在中層通過(guò)深度強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行規(guī)劃,選擇不同的操作單元,最終實(shí)現(xiàn)穩(wěn)定且復(fù)雜的操作流程。我們的方法結(jié)合了兩種方法的優(yōu)點(diǎn):在底層通過(guò)使用基于模型的操作單元,保證了手指與物體之間持續(xù)穩(wěn)定的抓;在中層使用強(qiáng)化學(xué)習(xí)進(jìn)行規(guī)劃,從而實(shí)現(xiàn)較長(zhǎng)和復(fù)雜的手內(nèi)操作流程。

 

2.  研究方法

在底層,我們使用柔性力矩控制器定義了三個(gè)操作單元,分別是reposing,sliding和flipping。Reposing是指在不改變手指與物體接觸點(diǎn)的前提下,通過(guò)控制機(jī)械手改變物體的位姿;sliding是指在不改變物體位姿的前提下,沿著物體滑動(dòng)指尖改變接觸點(diǎn);flipping是指將指頭從一側(cè)移動(dòng)到另一側(cè),從而改變抓握方式。在中層,我們使用深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)在給定目標(biāo)位姿下選擇底層操作單元,最終形成一條由大量不同操作單元組成的序列,實(shí)現(xiàn)復(fù)雜的操作目標(biāo)。



  



ICRA2020論文分享:基于視觸融合感知的可形變物體抓取狀態(tài)評(píng)估

人類可以通過(guò)視覺(jué)和觸覺(jué)融合感知快速確定抓取可變形物體所需力的大小,以防止其發(fā)生滑動(dòng)或過(guò)度形變,但這對(duì)于機(jī)器人來(lái)說(shuō)仍然是一個(gè)具有挑戰(zhàn)性的問(wèn)題

如何搭建一個(gè)GPU加速的分布式機(jī)器學(xué)習(xí)系統(tǒng),遇到的問(wèn)題和解決方法

能快速將現(xiàn)有算法在實(shí)際生產(chǎn)環(huán)境落地,并能利用GPU加速實(shí)現(xiàn)大規(guī)模計(jì)算,我們自己搭建了一個(gè)GPU加速的大規(guī)模分布式機(jī)器學(xué)習(xí)系統(tǒng),取名小諸葛

拯救渣畫質(zhì),馬賽克圖秒變高清,杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無(wú)法識(shí)別的人臉圖像轉(zhuǎn)換成計(jì)算機(jī)生成的圖像,其細(xì)節(jié)比之前任何時(shí)候都更加精細(xì)、逼真

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實(shí)踐

餓了么算法專家劉金介紹推薦業(yè)務(wù)背景,包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標(biāo);然后是算法的演進(jìn)路線;最后重點(diǎn)介紹在線學(xué)習(xí)是如何在餓了么推薦領(lǐng)域?qū)嵺`的

百變應(yīng)用場(chǎng)景下,優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù),算法應(yīng)用場(chǎng)景眾多,需求靈活多變,需要一套通用業(yè)務(wù)框架,支持運(yùn)行時(shí)的算法流程的裝配,提升算法服務(wù)場(chǎng)景搭建的效率

內(nèi)容流量管理的關(guān)鍵技術(shù):多任務(wù)保量?jī)?yōu)化算法實(shí)踐

通過(guò)分析其中的關(guān)鍵問(wèn)題,建立了新熱內(nèi)容曝光敏感模型,并最終給出一種曝光資源約束下的多目標(biāo)優(yōu)化保量框架與算法

CVPOS自助收銀的挑戰(zhàn)以及商品識(shí)別算法工程落地方法和經(jīng)驗(yàn)

針對(duì)結(jié)算收銀場(chǎng)景中商品識(shí)別的難點(diǎn),從商品識(shí)別落地中的模型選擇、數(shù)據(jù)挑選與標(biāo)注、前端和云端部署、模型改進(jìn)等方面,進(jìn)行了深入講解

面向動(dòng)態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結(jié)構(gòu)融合學(xué)習(xí)和記憶功能領(lǐng)域的研究主要集中在人工突觸的可塑性方面,同時(shí)神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實(shí)現(xiàn)中也很重要

人工智能和機(jī)器學(xué)習(xí)之間的差異及其重要性

機(jī)器學(xué)習(xí)就是通過(guò)經(jīng)驗(yàn)來(lái)尋找它學(xué)習(xí)的模式,而人工智能是利用經(jīng)驗(yàn)來(lái)獲取知識(shí)和技能,并將這些知識(shí)應(yīng)用于新的環(huán)境

滴滴機(jī)器學(xué)習(xí)平臺(tái)調(diào)度系統(tǒng)的演進(jìn)與K8s二次開(kāi)發(fā)

滴滴機(jī)器學(xué)習(xí)場(chǎng)景下的 k8s 落地實(shí)踐與二次開(kāi)發(fā)的技術(shù)實(shí)踐與經(jīng)驗(yàn),包括平臺(tái)穩(wěn)定性、易用性、利用率、平臺(tái) k8s 版本升級(jí)與二次開(kāi)發(fā)等內(nèi)容

如何更高效地壓縮時(shí)序數(shù)據(jù)?基于深度強(qiáng)化學(xué)習(xí)的探索

大型商用時(shí)序數(shù)據(jù)壓縮的特性,提出了一種新的算法,分享用深度強(qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索

基于深度學(xué)習(xí)目標(biāo)檢測(cè)模型優(yōu)缺點(diǎn)對(duì)比

深度學(xué)習(xí)模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來(lái)3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無(wú)主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運(yùn)營(yíng)體系(ML0ps)實(shí)踐指
» 四驅(qū)四轉(zhuǎn)移動(dòng)機(jī)器人運(yùn)動(dòng)模型及應(yīng)用分析
» 國(guó)內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場(chǎng)景
» 國(guó)內(nèi)科技大廠布局生成式 AI,未來(lái)有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場(chǎng)景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場(chǎng)景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤(rùn)機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國(guó)運(yùn)營(yíng)中心:北京·清華科技園九號(hào)樓5層     中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728