Robot Learning Incorporating Human Interventions in the Real World for Autonomous Surgical Endoscopic Camera Control

人工智能 强化学习 计算机科学 模仿 机器人 对象(语法) 过程(计算) 机器人学 心理干预 任务(项目管理) 计算机视觉 人机交互 心理学 工程类 操作系统 精神科 社会心理学 系统工程
作者
Yafei Ou,Sadra Zargarzadeh,Mahdi Tavakoli
出处
期刊:Journal of medical robotics research [World Scientific]
卷期号:08 (03n04)
标识
DOI:10.1142/s2424905x23400044
摘要

Recent studies in surgical robotics have focused on automating common surgical subtasks such as grasping and manipulation using deep reinforcement learning (DRL). In this work, we consider surgical endoscopic camera control for object tracking e.g. using the endoscopic camera manipulator (ECM) from the da Vinci Research Kit (dVRK) (Intuitive Inc., Sunnyvale, CA, USA) as a typical surgical robot learning task. A DRL policy for controlling the robot joint space movements is first trained in a simulation environment and then continues the learning in the real world. To speed up training and avoid significant failures (in this case, losing view of the object), human interventions are incorporated into the training process and regular DRL is combined with generative adversarial imitation learning (GAIL) to encourage imitating human behaviors. Experiments show that an average reward of 159.8 can be achieved within 1000 steps compared to only 121.8 without human interventions, and the view of the moving object is lost only twice during the training process out of 3 trials. These results show that human interventions can improve learning speed and significantly reduce failures during the training process.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
等待思远完成签到,获得积分10
刚刚
刚刚
Mr.Jian完成签到,获得积分10
刚刚
共享精神应助郭辉采纳,获得10
2秒前
2秒前
汉堡包应助科研通管家采纳,获得10
7秒前
领导范儿应助科研通管家采纳,获得20
7秒前
科目三应助科研通管家采纳,获得10
7秒前
科研通AI5应助科研通管家采纳,获得10
7秒前
7秒前
共享精神应助科研通管家采纳,获得10
7秒前
充电宝应助科研通管家采纳,获得10
7秒前
半柚发布了新的文献求助10
8秒前
含糊的灵雁完成签到,获得积分10
8秒前
10秒前
羲月发布了新的文献求助10
14秒前
小透明发布了新的文献求助20
19秒前
20秒前
李爱国应助氢气采纳,获得10
22秒前
盛夏如花发布了新的文献求助20
22秒前
嗒嗒小医生关注了科研通微信公众号
24秒前
昨日无风发布了新的文献求助30
25秒前
26秒前
白色城堡发布了新的文献求助10
30秒前
30秒前
33秒前
33秒前
斯文败类应助昨日无风采纳,获得10
34秒前
在喝咖啡ing完成签到,获得积分10
36秒前
阿清完成签到 ,获得积分10
37秒前
杨沛儒发布了新的文献求助10
37秒前
萝卜完成签到 ,获得积分10
40秒前
zhao发布了新的文献求助10
40秒前
SOBER刘晗完成签到 ,获得积分10
41秒前
41秒前
46秒前
pluto应助盛夏如花采纳,获得10
48秒前
50秒前
polaris完成签到,获得积分10
50秒前
52秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Computational Atomic Physics for Kilonova Ejecta and Astrophysical Plasmas 500
Technologies supporting mass customization of apparel: A pilot project 450
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3782342
求助须知:如何正确求助?哪些是违规求助? 3327852
关于积分的说明 10233274
捐赠科研通 3042733
什么是DOI,文献DOI怎么找? 1670153
邀请新用户注册赠送积分活动 799658
科研通“疑难数据库(出版商)”最低求助积分说明 758876