基于增强学习的计算机博弈策略的研究与实现

摘要	第1-7页
Abstract	第7-11页
第1章绪论	第11-15页
·研究背景	第11-12页
·研究意义	第12页
·国内外研究现状及存在问题	第12-14页
·国内研究现状	第12-13页
·国外研究现状	第13-14页
·目前研究所存在的问题	第14页
·本文工作	第14-15页
·研究内容	第14-15页
·论文的组织结构	第15页
第2章计算机博弈中的关键技术	第15-26页
·棋盘的表示	第18页
·走法生成	第18-19页
·搜索算法	第19-23页
·博弈树	第20-21页
·极大极小值算法	第21-22页
·负极大值算法	第22页
·Alpha-Beta 搜索算法	第22-23页
·其他搜索算法	第23页
·估值	第23-25页
·静态估值函数	第24页
·静态估值函数存在的问题	第24-25页
·本章小结	第25-26页
第3章增强学习及神经网络理论	第26-37页
·增强学习	第26-31页
·增强学习算法原理	第27-29页
·评价函数P(s,a)	第29-30页
·TD(λ)算法	第30-31页
·神经网络	第31-36页
·神经元模型和网络结构	第31-33页
·反向传播算法	第33-36页
·本章小结	第36-37页
第4章估值算法与博弈训练的研究	第37-54页
·BP-TD(λ)学习算法	第37-40页
·BP 神经网络	第40-47页
·五子棋特征	第40-44页
·BP 神经元网络的设计	第44-47页
·BP-TD 强化学习过程	第47-48页
·博弈训练的研究及优化	第48-53页
·博弈训练的方式	第48-50页
·博弈训练的优化	第50-52页
·博弈训练中的探索和利用	第52-53页
·本章小结	第53-54页
第5章基于增强学习的五子棋博弈系统	第54-67页
·开发环境和工具	第54页
·系统实现	第54-59页
·系统总体功能的实现	第54-56页
·自学习功能的实现	第56-57页
·分阶段设置参数值的实现	第57-58页
·自学习训练	第58-59页
·试验结果分析	第59-66页
·神经元网络输入输出分析	第59-61页
·分阶段设置参数值的性能分析	第61-64页
·参数取值问题	第64页
·系统性能比较	第64-65页
·系统性能的提高	第65-66页
·本章小结	第66-67页
结论	第67-69页
参考文献	第69-73页
攻读硕士学位期间发表的论文和取得的科研成果	第73-74页
致谢	第74-75页