Robotic Arm Control and Task Training Through Deep Reinforcement Learning

强化学习 计算机科学 任务(项目管理) 人工智能 控制(管理) 机器人 功能(生物学) 机械臂 动作(物理) 利用 机器学习 工程类 物理 系统工程 生物 进化生物学 量子力学 计算机安全
作者
A Franceschetti,Elisa Tosello,Nicola Castaman,Stefano Ghidoni
出处
期刊:Lecture notes in networks and systems 卷期号:: 532-550 被引量:5
标识
DOI:10.1007/978-3-030-95892-3_41
摘要

Deep Reinforcement Learning (DRL) is a promising Machine Learning technique that enables robotic systems to efficiently learn high dimensional control policies. However, generating good policies requires carefully define appropriate reward functions, state, and action spaces. There is no unique methodology to make these choices, and parameter tuning is time-consuming. In this paper, we investigate how the choice of both the reward function and hyper-parameters affects the quality of the policy learned. To this aim, we compare four DRL algorithms when learning continuous torque control policies for manipulation tasks via a model-free approach. In detail, we simulate one manipulator robot and formulate two tasks: a random target reaching and a pick&place application, each with two different reward functions. Then, we select the algorithms, multiple hyper-parameters, and exhaustively compare their learning performance across the two tasks. Finally, we include the simulated and real-world execution of our best policies. The obtained performance demonstrates the validity of our proposal. Users can follow our approach when selecting the best-performing algorithm according to the assignment. Moreover, they can exploit our results to solve the same tasks, even with other manipulator robots. Generated policies will be easily portable to a physical setup while guaranteeing a perfect match between the simulated and real behaviors.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
搬砖工人完成签到,获得积分10
1秒前
单薄茗发布了新的文献求助10
1秒前
文弱书生发布了新的文献求助10
2秒前
2秒前
4秒前
高兴白开水完成签到,获得积分10
6秒前
ding应助dxszing采纳,获得10
6秒前
Manzia完成签到,获得积分10
6秒前
zjq完成签到 ,获得积分10
8秒前
下北泽发布了新的文献求助10
9秒前
water发布了新的文献求助10
9秒前
学术废物完成签到 ,获得积分10
12秒前
...完成签到,获得积分10
12秒前
下北泽完成签到,获得积分10
13秒前
14秒前
洛尚发布了新的文献求助10
15秒前
傲娇紫烟完成签到,获得积分10
16秒前
东子发布了新的文献求助10
18秒前
小马甲应助畅彤采纳,获得30
21秒前
我是老大应助fryeia采纳,获得10
22秒前
轻松的芯完成签到 ,获得积分10
23秒前
Lucas应助科研小白采纳,获得10
24秒前
鹏鱼燕完成签到,获得积分10
25秒前
杨品完成签到,获得积分10
26秒前
27秒前
water完成签到,获得积分10
29秒前
小灰灰完成签到 ,获得积分10
30秒前
WuCola完成签到 ,获得积分10
31秒前
单薄茗完成签到,获得积分20
32秒前
畅彤发布了新的文献求助30
32秒前
37秒前
rfgfg完成签到 ,获得积分10
38秒前
42秒前
喵喵完成签到,获得积分10
42秒前
42秒前
42秒前
畅彤完成签到,获得积分20
42秒前
SOLOMON应助杨品采纳,获得10
43秒前
赘婿应助受伤易巧采纳,获得10
43秒前
qi完成签到,获得积分10
44秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2469432
求助须知:如何正确求助?哪些是违规求助? 2136556
关于积分的说明 5443960
捐赠科研通 1860994
什么是DOI,文献DOI怎么找? 925582
版权声明 562702
科研通“疑难数据库(出版商)”最低求助积分说明 495140