首页--文化、科学、教育、体育论文--体育论文--文体活动论文--棋类论文--中国象棋论文

基于激励学习的中国象棋研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-14页
   ·人机博弈的发展现状第9页
   ·电脑中国象棋的发展现状第9-11页
   ·激励学习在棋类中应用的现状分析第11页
   ·本文研究的主要内容及其意义第11-14页
第2章 背景知识第14-24页
   ·电脑棋类博弈算法简介第14-19页
     ·数据结构第14-15页
     ·走法产生第15-16页
     ·搜索技术第16-18页
     ·估值函数第18-19页
   ·学习方法简介第19-23页
     ·激励学习(Reinforcement Learning)发展背景第20页
     ·基本原理第20-22页
     ·主要算法简介第22页
     ·瞬时差分(Temporal Difference)算法简介第22-23页
   ·本章小结第23-24页
第3章 中国象棋环境设计与实现第24-30页
   ·中国象棋的状态表达第24-26页
   ·中国象棋的动作表达第26-28页
     ·走法产生第27-28页
     ·走法存储第28页
   ·中国象棋的操作界面第28-29页
   ·本章小结第29-30页
第4 章基于搜索的中国象棋设计与实现第30-36页
   ·智能体A 的数据结构第31-32页
   ·智能体A 的走法产生第32页
   ·智能体A 使用的搜索算法第32-33页
   ·智能体A 使用的估值函数第33-35页
   ·本章小结第35-36页
第5章 激励学习和神经网络结合的中国象棋设计与实现第36-43页
   ·算法原理第36-37页
   ·学习体A 的构建第37-38页
   ·算法实现第38-42页
     ·网络结构设计第38-39页
     ·TD 预测网络误差第39-40页
     ·误差逆传播学习原理第40-41页
     ·TD 学习法具体步骤第41-42页
   ·本章小结第42-43页
第6章 激励学习与数据库结合的中国象棋设计与实现第43-51页
   ·学习体B 的构建第43-44页
   ·算法实现第44-50页
     ·分级数据库原理第44-45页
     ·分级数据库实现第45-48页
     ·学习具体步骤第48-49页
     ·使用启发式函数指导学习第49-50页
     ·探索与利用第50页
   ·本章小结第50-51页
第7章 实验结果第51-57页
   ·激励学习算法结合神经网络的结果及比较第51-53页
     ·实验结果第51-53页
     ·与其它同类程序比较第53页
   ·激励学习算法结合数据库的结果及比较第53-56页
     ·实验结果第53-55页
     ·是否使用启发函数的比较第55-56页
   ·本章小结第56-57页
结论第57-58页
参考文献第58-62页
致谢第62-63页
附录A(攻读学位期间发表的学术论文)第63-64页
附录B(攻读硕士学位期间参与研究的科研项目)第64-65页
中文详细摘要第65-72页

论文共72页,点击 下载论文
上一篇:污水处理厂二次沉淀池模型研究
下一篇:海面杂波仿真与目标检测算法研究