首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于增强学习的计算机博弈策略的研究与实现

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-15页
   ·研究背景第11-12页
   ·研究意义第12页
   ·国内外研究现状及存在问题第12-14页
     ·国内研究现状第12-13页
     ·国外研究现状第13-14页
     ·目前研究所存在的问题第14页
   ·本文工作第14-15页
     ·研究内容第14-15页
     ·论文的组织结构第15页
第2章 计算机博弈中的关键技术第15-26页
   ·棋盘的表示第18页
   ·走法生成第18-19页
   ·搜索算法第19-23页
     ·博弈树第20-21页
     ·极大极小值算法第21-22页
     ·负极大值算法第22页
     ·Alpha-Beta 搜索算法第22-23页
     ·其他搜索算法第23页
   ·估值第23-25页
     ·静态估值函数第24页
     ·静态估值函数存在的问题第24-25页
   ·本章小结第25-26页
第3章 增强学习及神经网络理论第26-37页
   ·增强学习第26-31页
     ·增强学习算法原理第27-29页
     ·评价函数P(s,a)第29-30页
     ·TD(λ)算法第30-31页
   ·神经网络第31-36页
     ·神经元模型和网络结构第31-33页
     ·反向传播算法第33-36页
   ·本章小结第36-37页
第4章 估值算法与博弈训练的研究第37-54页
   ·BP-TD(λ)学习算法第37-40页
   ·BP 神经网络第40-47页
     ·五子棋特征第40-44页
     ·BP 神经元网络的设计第44-47页
   ·BP-TD 强化学习过程第47-48页
   ·博弈训练的研究及优化第48-53页
     ·博弈训练的方式第48-50页
     ·博弈训练的优化第50-52页
     ·博弈训练中的探索和利用第52-53页
   ·本章小结第53-54页
第5章 基于增强学习的五子棋博弈系统第54-67页
   ·开发环境和工具第54页
   ·系统实现第54-59页
     ·系统总体功能的实现第54-56页
     ·自学习功能的实现第56-57页
     ·分阶段设置参数值的实现第57-58页
     ·自学习训练第58-59页
   ·试验结果分析第59-66页
     ·神经元网络输入输出分析第59-61页
     ·分阶段设置参数值的性能分析第61-64页
     ·参数取值问题第64页
     ·系统性能比较第64-65页
     ·系统性能的提高第65-66页
   ·本章小结第66-67页
结论第67-69页
参考文献第69-73页
攻读硕士学位期间发表的论文和取得的科研成果第73-74页
致谢第74-75页

论文共75页,点击 下载论文
上一篇:基于WEB的净水厂自动控制系统的设计与实现
下一篇:基于计算机视觉的刀具磨损检测技术的研究