强化学习及其在协同虚拟环境导航知识中的应用研究

中文摘要	第1-4页
英文摘要	第4-9页
1 绪论	第9-15页
·研究背景及意义	第9-11页
·强化学习在导航中的研究概况	第11-14页
·论文主要研究内容和创新点	第14-15页
2 强化学习理论及算法	第15-27页
·强化学习简介	第15-16页
·强化学习的基本原理及模型	第16-18页
·强化学习的基本原理	第16页
·强化学习的标准模型	第16-18页
·强化学习的特点及主要组成要素	第18-20页
·强化学习的主要算法	第20-26页
·马尔可夫决策过程(MDP)模型	第20-22页
·时间差分算法	第22-24页
·Q-学习算法	第24-26页
·本章小结	第26-27页
3 协同虚拟环境概述	第27-37页
·协同虚拟环境基本定义	第27-30页
·协同虚拟环境特点	第30-32页
·协同虚拟环境主要结构和模型	第32-35页
·协同虚拟环境参考体系结构	第32-33页
·协同虚拟环境网络拓扑结构	第33-34页
·协同虚拟环境通用信息模型	第34-35页
·本章小结	第35-37页
4 多Agent协同导航模型	第37-49页
·虚拟环境中的导航的定义	第37-38页
·主动导航与被动导航	第38-39页
·单用户导航模型	第39-44页
·Spence的导航模型	第40-41页
·Bakker的虚拟环境导航模型	第41-42页
·Jiu-Lin的寻路与导航概念模型	第42-44页
·多Agent协同导航模型	第44-47页
·协同导航的特点	第44-45页
·多Agent协同导航模型	第45-47页
·本章小结	第47-49页
5 基于改进的Q-学习在协同虚拟环境导航知识中的应用	第49-67页
·基本思想	第49-50页
·基于最优路径的Q-学习算法	第50-52页
·试验仿真与试验结果分析	第52-55页
·基于最优路径的并行Q-学习算法在多Agent协同虚拟环境中的应用	第55-65页
·基于最优路径的并行Q-学习算法主要原理	第56-61页
·实验仿真及结果分析	第61-65页
·本章小结	第65-67页
6 总结与展望	第67-69页
参考文献	第69-71页
附录	第71-72页
致谢	第72-73页