中文摘要 | 第1-7页 |
第一章 绪论 | 第7-10页 |
第二章 问题表示 | 第10-13页 |
第三章 博弈树搜索技术 | 第13-23页 |
3.1 极小极大树搜索算法 | 第13-16页 |
3.2 α-β剪枝过程 | 第16-19页 |
3.3 α-β剪枝存在的问题及优化 | 第19-20页 |
3.4 NegeScout搜索 | 第20-23页 |
第四章 静态估值函数 | 第23-27页 |
4.1 棋盘局势特征 | 第23-25页 |
4.2 估值 | 第25-26页 |
4.3 初版的实践结果及不足 | 第26-27页 |
第五章 TD强化学习法 | 第27-39页 |
5.1 TD预测 | 第27-28页 |
5.2 BP神经网络 | 第28-36页 |
5.3 TD与神经网络结合 | 第36-39页 |
第六章 编程与实践结果 | 第39-44页 |
6.1 编程 | 第39-40页 |
6.2 实践结果及神经网络学习参数选择 | 第40-42页 |
6.3 讨论 | 第42-44页 |
参考文献 | 第44-46页 |
致谢 | 第46页 |