基于深度强化学习的室内移动机器人路径规划研究

致谢	第3-4页
摘要	第4-5页
abstract	第5页
变量注释表	第16-19页
1 绪论	第19-27页
1.1 概述	第19-22页
1.2 机器人路径规划研究现状	第22-25页
1.3 本文研究内容	第25-27页
2 强化学习算法	第27-55页
2.1 强化学习八要素	第27-28页
2.2 马尔科夫决策过程	第28-29页
2.3 基于值函数的强化学习算法	第29-39页
2.4 基于策略的强化学习方法	第39-54页
2.5 本章小结	第54-55页
3 深度强化学习算法	第55-69页
3.1 深度学习算法	第55-59页
3.2 深度强化学习算法	第59-67页
3.3 本章小结	第67-69页
4 基于DRL的室内路径规划算法改进	第69-87页
4.1 深度强化学习中的神经网络改进	第69-76页
4.2 结合迁移学习的DRL算法改进	第76-79页
4.3 基于DDPG的目标价值网络算法改进	第79-84页
4.4 基于异步方法的算法改进	第84-85页
4.5 本章小结	第85-87页
5 基于改进算法的实验过程	第87-129页
5.1 室内仿真环境搭建	第87-100页
5.2 室内机器人运动控制	第100-108页
5.3 基于改进算法的仿真	第108-126页
5.4 基于改进算法的场地测试	第126-127页
5.5 本章小结	第127-129页
6 总结与展望	第129-131页
6.1 总结	第129-130页
6.2 展望	第130-131页
参考文献	第131-135页
作者简历	第135-139页
学位论文数据集	第139页