| 中文摘要 | 第1-7页 |
| 第一章 绪论 | 第7-10页 |
| 第二章 问题表示 | 第10-13页 |
| 第三章 博弈树搜索技术 | 第13-23页 |
| 3.1 极小极大树搜索算法 | 第13-16页 |
| 3.2 α-β剪枝过程 | 第16-19页 |
| 3.3 α-β剪枝存在的问题及优化 | 第19-20页 |
| 3.4 NegeScout搜索 | 第20-23页 |
| 第四章 静态估值函数 | 第23-27页 |
| 4.1 棋盘局势特征 | 第23-25页 |
| 4.2 估值 | 第25-26页 |
| 4.3 初版的实践结果及不足 | 第26-27页 |
| 第五章 TD强化学习法 | 第27-39页 |
| 5.1 TD预测 | 第27-28页 |
| 5.2 BP神经网络 | 第28-36页 |
| 5.3 TD与神经网络结合 | 第36-39页 |
| 第六章 编程与实践结果 | 第39-44页 |
| 6.1 编程 | 第39-40页 |
| 6.2 实践结果及神经网络学习参数选择 | 第40-42页 |
| 6.3 讨论 | 第42-44页 |
| 参考文献 | 第44-46页 |
| 致谢 | 第46页 |