| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-18页 |
| ·课题背景 | 第9页 |
| ·机器学习在导航中的研究概况 | 第9-12页 |
| ·强化学习的历史现状及主要存在问题 | 第12-16页 |
| ·本课题的主要研究内容 | 第16-18页 |
| 第2章 强化学习基础理论介绍 | 第18-38页 |
| ·强化学习 | 第18-25页 |
| ·分布式强化学习 | 第25-31页 |
| ·模拟退火算法 | 第31-33页 |
| ·神经网络 | 第33-36页 |
| ·本章小结 | 第36-38页 |
| 第3章 基于改进 Q-学习的导航知识获取算法 | 第38-46页 |
| ·平衡强化学习中探索和利用的主要算法 | 第38-41页 |
| ·基于探索区域扩张策略的Q-学习算法 | 第41-42页 |
| ·实验及结果分析 | 第42-45页 |
| ·本章小结 | 第45-46页 |
| 第4章 基于神经网络的 Q-学习 | 第46-53页 |
| ·强化学习的泛化方法概况 | 第46-48页 |
| ·基于BP 神经网络的Q-学习 | 第48-50页 |
| ·实验及结果分析 | 第50-52页 |
| ·本章小结 | 第52-53页 |
| 结论 | 第53-54页 |
| 致谢 | 第54-55页 |
| 参考文献 | 第55-59页 |