基于机器学习的人机博弈的研究与实现
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-13页 |
| 第一章 绪论 | 第13-20页 |
| ·人机博弈的概述 | 第13页 |
| ·人机博弈的研究历史 | 第13-14页 |
| ·人机博弈的研究意义 | 第14-16页 |
| ·人机博弈所面临的主要问题 | 第16-17页 |
| ·论文的研究内容和创新点 | 第17-18页 |
| ·研究内容 | 第17-18页 |
| ·创新点 | 第18页 |
| ·论文的章节安排 | 第18-19页 |
| ·本章小结 | 第19-20页 |
| 第二章 模型的建立与走法规则的实现 | 第20-30页 |
| ·计算机象棋博弈模型的建立 | 第20-24页 |
| ·状态空间法在象棋中的具体应用 | 第20-21页 |
| ·象棋模型在计算机中的具体实现 | 第21-24页 |
| ·走法规则的实现 | 第24-29页 |
| ·棋子走法的产生式规则 | 第24-27页 |
| ·棋子走法规则在计算机中的具体实现 | 第27-29页 |
| ·本章小结 | 第29-30页 |
| 第三章 搜索算法与评价函数 | 第30-48页 |
| ·博弈树 | 第30-31页 |
| ·基本搜索算法 | 第31-36页 |
| ·极大极小搜索法 | 第31-33页 |
| ·Alpha-Beta剪枝算法 | 第33-36页 |
| ·改进的搜索算法 | 第36-43页 |
| ·Alpha-Beta剪枝法的缺点 | 第36-37页 |
| ·基于记录表的Alpha-Beta剪枝算法 | 第37-40页 |
| ·基于分值表的Alpha-Beta剪枝算法 | 第40-43页 |
| ·评价函数 | 第43-47页 |
| ·评价函数的意义 | 第43页 |
| ·评价函数在本次设计中所包含的内容 | 第43-47页 |
| 1、子力价值 | 第43-44页 |
| 2、棋子间的位置关系 | 第44-46页 |
| 3、静态评价函数的构造 | 第46-47页 |
| ·本章小结 | 第47-48页 |
| 第四章 机器学习功能在本次设计中的具体实现 | 第48-70页 |
| ·机器学习概述 | 第48-49页 |
| ·神经网络概述 | 第49-50页 |
| ·BP神经网络与反向传播算法 | 第50-55页 |
| ·BP神经网络模型 | 第50-51页 |
| ·反向传播算法 | 第51-55页 |
| ·遗传算法及其方案选择和参数设置 | 第55-60页 |
| ·遗传算法简介 | 第55-56页 |
| ·遗传算法在本次设计中的方案选择和参数设置 | 第56-60页 |
| 1、编码的方式 | 第57页 |
| 2、适应度函数的选取 | 第57-58页 |
| 3、选择操作 | 第58页 |
| 4、交叉操作 | 第58页 |
| 5、变异操作 | 第58-60页 |
| ·评价函数学习过程的具体实现 | 第60-69页 |
| ·神经网络教师信号的确定 | 第60-61页 |
| ·评价函数神经网络模型的建立 | 第61-66页 |
| ·评价函数学习的具体步骤 | 第66-69页 |
| ·本章小结 | 第69-70页 |
| 第五章 程序说明和实验数据分析 | 第70-83页 |
| ·主要程序文件的说明 | 第70-71页 |
| ·程序界面概述 | 第71-73页 |
| ·实验的结果和分析 | 第73-82页 |
| ·搜索算法的比较和分析 | 第73-75页 |
| ·博弈程序学习的结果和分析 | 第75-82页 |
| ·本章小结 | 第82-83页 |
| 结论与展望 | 第83-85页 |
| 参考文献 | 第85-89页 |
| 附录(主要的程序代码) | 第89-119页 |
| 攻读硕士学位期间发表的学术论文 | 第119-120页 |
| 致谢 | 第120页 |