自主机器人的强化学习研究进展


Autoria(s): 陈卫东; 席裕庚; 顾冬雷
Data(s)

2001

Resumo

虽然基于行为控制自主机器人具有较高的鲁棒性,但其对于动态环境缺乏必要的自适应能力,强化学习方法使机器人可以通过学习来完成任务,而无需设计者完全预先规定机器人的所有动作,它是将动态规划和监督学习结合的基础上发展起来的一种新颖的学习方法,它通过机器人与环境的试错交互,利用来自成功和失败经验的奖励和惩罚信号不断改进机器人的性能,从而达到目标,并容许滞后评价,由于其解决复杂问题的突出能力,强化学习已成为一种非常有前途的机器人学习方法,本文系统论述了强化学习方法在自主机器人中的研究现状,指出了存在的问题,分析了几种问题解决途径,展望了未来发展趋势。

Even though autonomous mobile robots based on behaviour approaches are robust for many tasks and environments, they are not necessarily adaptive for dynamic environments. Reinforcement learning (RL) offers a powerful set of techniques that allow a robot to learn a task without requiring its designer to fully specify how it should be carried out. RL is a novel approach to machine intelligence that combines dynamic programming and supervised learning. RL is widely noticed as a promising method for robot learn...

国家自然科学基金重点项目 ( 698895 0 1 );; 863计划项目 ( 863- 5 1 2 - 935 5 - 0 2 )

Identificador

http://ir.sia.ac.cn//handle/173321/3343

http://www.irgrid.ac.cn/handle/1471x/171862

Idioma(s)

中文

Palavras-Chave #强化学习 #自主机器人 #人工智能 #鲁棒性
Tipo

期刊论文