首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--计算机仿真论文

强化学习及其在协同虚拟环境导航知识中的应用研究

中文摘要第1-4页
英文摘要第4-9页
1 绪论第9-15页
   ·研究背景及意义第9-11页
   ·强化学习在导航中的研究概况第11-14页
   ·论文主要研究内容和创新点第14-15页
2 强化学习理论及算法第15-27页
   ·强化学习简介第15-16页
   ·强化学习的基本原理及模型第16-18页
     ·强化学习的基本原理第16页
     ·强化学习的标准模型第16-18页
   ·强化学习的特点及主要组成要素第18-20页
   ·强化学习的主要算法第20-26页
     ·马尔可夫决策过程(MDP)模型第20-22页
     ·时间差分算法第22-24页
     ·Q-学习算法第24-26页
   ·本章小结第26-27页
3 协同虚拟环境概述第27-37页
   ·协同虚拟环境基本定义第27-30页
   ·协同虚拟环境特点第30-32页
   ·协同虚拟环境主要结构和模型第32-35页
     ·协同虚拟环境参考体系结构第32-33页
     ·协同虚拟环境网络拓扑结构第33-34页
     ·协同虚拟环境通用信息模型第34-35页
   ·本章小结第35-37页
4 多Agent协同导航模型第37-49页
   ·虚拟环境中的导航的定义第37-38页
   ·主动导航与被动导航第38-39页
   ·单用户导航模型第39-44页
     ·Spence的导航模型第40-41页
     ·Bakker的虚拟环境导航模型第41-42页
     ·Jiu-Lin的寻路与导航概念模型第42-44页
   ·多Agent协同导航模型第44-47页
     ·协同导航的特点第44-45页
     ·多Agent协同导航模型第45-47页
   ·本章小结第47-49页
5 基于改进的Q-学习在协同虚拟环境导航知识中的应用第49-67页
   ·基本思想第49-50页
   ·基于最优路径的Q-学习算法第50-52页
   ·试验仿真与试验结果分析第52-55页
   ·基于最优路径的并行Q-学习算法在多Agent协同虚拟环境中的应用第55-65页
     ·基于最优路径的并行Q-学习算法主要原理第56-61页
     ·实验仿真及结果分析第61-65页
   ·本章小结第65-67页
6 总结与展望第67-69页
参考文献第69-71页
附录第71-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:基于Android平台的即时通讯系统的研究与实现
下一篇:基于本体的动画素材图像语义标注研究