激励势场算法收敛性研究

摘要	第1-6页
ABSTRACT	第6-9页
第一章引言	第9-17页
·本文研究背景	第9页
·算法的有关理论	第9-12页
·近代重要优化算法	第9-10页
·机器人导航算法	第10-12页
·收敛性	第12-14页
·数列收敛的定义	第12页
·函数列及其一致收敛性	第12-13页
·基本迭代算法的收敛性	第13页
·收敛性及算法收敛性定义	第13-14页
·国内外机器学习有关收敛性问题研究	第14-15页
·激励学习算法收敛性	第14-15页
·国内外机器学习收敛性的相关研究进展	第15页
·本文研究内容	第15-16页
·本文内容组织结构	第16-17页
第二章人工势场法	第17-22页
·人工势场的引入	第17页
·势函数的定义	第17-19页
·人工势场法基本思想	第19-20页
·人工势场方法	第20页
·本章小结	第20-22页
第三章激励学习理论	第22-30页
·马尔可夫决策过程和激励学习	第22-23页
·激励学习结构与原理	第23页
·激励学习系统的组成要素	第23-25页
·激励学习的基本算法	第25-26页
·TD 算法	第25-26页
·Q-学习	第26页
·Sarsa 算法	第26页
·激励学习算法的有关的收敛性证明	第26-27页
·激励学习中的函数逼近	第27-29页
·本章小结	第29-30页
第四章激励势场及虚拟水流法数学模型	第30-38页
·局部最小问题的产生	第30-31页
·局部最小问题	第31-32页
·虚拟水流法	第32-34页
·实验结果比较	第34-36页
·四房间网格世界模型	第34-35页
·四方位四房间网格世界模型	第35-36页
·虚拟水流算法提炼的一维数学模型	第36页
·本章小结	第36-38页
第五章虚拟水流算法收敛性研究	第38-48页
·虚拟水流算法提炼的二维数学模型	第38页
·算法收敛性证明	第38-48页
·证明总体思路	第38-39页
·证明过程	第39-48页
第六章总结与展望	第48-49页
·总结	第48页
·研究展望	第48-49页
参考文献	第49-53页
致谢	第53-54页
附录（攻读硕士学位期间发表的论文目录和参加的科研项目）	第54页