基于机器学习的人机博弈的研究与实现
摘要 | 第1-7页 |
ABSTRACT | 第7-13页 |
第一章 绪论 | 第13-20页 |
·人机博弈的概述 | 第13页 |
·人机博弈的研究历史 | 第13-14页 |
·人机博弈的研究意义 | 第14-16页 |
·人机博弈所面临的主要问题 | 第16-17页 |
·论文的研究内容和创新点 | 第17-18页 |
·研究内容 | 第17-18页 |
·创新点 | 第18页 |
·论文的章节安排 | 第18-19页 |
·本章小结 | 第19-20页 |
第二章 模型的建立与走法规则的实现 | 第20-30页 |
·计算机象棋博弈模型的建立 | 第20-24页 |
·状态空间法在象棋中的具体应用 | 第20-21页 |
·象棋模型在计算机中的具体实现 | 第21-24页 |
·走法规则的实现 | 第24-29页 |
·棋子走法的产生式规则 | 第24-27页 |
·棋子走法规则在计算机中的具体实现 | 第27-29页 |
·本章小结 | 第29-30页 |
第三章 搜索算法与评价函数 | 第30-48页 |
·博弈树 | 第30-31页 |
·基本搜索算法 | 第31-36页 |
·极大极小搜索法 | 第31-33页 |
·Alpha-Beta剪枝算法 | 第33-36页 |
·改进的搜索算法 | 第36-43页 |
·Alpha-Beta剪枝法的缺点 | 第36-37页 |
·基于记录表的Alpha-Beta剪枝算法 | 第37-40页 |
·基于分值表的Alpha-Beta剪枝算法 | 第40-43页 |
·评价函数 | 第43-47页 |
·评价函数的意义 | 第43页 |
·评价函数在本次设计中所包含的内容 | 第43-47页 |
1、子力价值 | 第43-44页 |
2、棋子间的位置关系 | 第44-46页 |
3、静态评价函数的构造 | 第46-47页 |
·本章小结 | 第47-48页 |
第四章 机器学习功能在本次设计中的具体实现 | 第48-70页 |
·机器学习概述 | 第48-49页 |
·神经网络概述 | 第49-50页 |
·BP神经网络与反向传播算法 | 第50-55页 |
·BP神经网络模型 | 第50-51页 |
·反向传播算法 | 第51-55页 |
·遗传算法及其方案选择和参数设置 | 第55-60页 |
·遗传算法简介 | 第55-56页 |
·遗传算法在本次设计中的方案选择和参数设置 | 第56-60页 |
1、编码的方式 | 第57页 |
2、适应度函数的选取 | 第57-58页 |
3、选择操作 | 第58页 |
4、交叉操作 | 第58页 |
5、变异操作 | 第58-60页 |
·评价函数学习过程的具体实现 | 第60-69页 |
·神经网络教师信号的确定 | 第60-61页 |
·评价函数神经网络模型的建立 | 第61-66页 |
·评价函数学习的具体步骤 | 第66-69页 |
·本章小结 | 第69-70页 |
第五章 程序说明和实验数据分析 | 第70-83页 |
·主要程序文件的说明 | 第70-71页 |
·程序界面概述 | 第71-73页 |
·实验的结果和分析 | 第73-82页 |
·搜索算法的比较和分析 | 第73-75页 |
·博弈程序学习的结果和分析 | 第75-82页 |
·本章小结 | 第82-83页 |
结论与展望 | 第83-85页 |
参考文献 | 第85-89页 |
附录(主要的程序代码) | 第89-119页 |
攻读硕士学位期间发表的学术论文 | 第119-120页 |
致谢 | 第120页 |