机器自学习博弈策略研究与实现

中文摘要	第1-7页
第一章绪论	第7-10页
第二章问题表示	第10-13页
第三章博弈树搜索技术	第13-23页
3．1 极小极大树搜索算法	第13-16页
3．2 α－β剪枝过程	第16-19页
3．3 α－β剪枝存在的问题及优化	第19-20页
3．4 NegeScout搜索	第20-23页
第四章静态估值函数	第23-27页
4．1 棋盘局势特征	第23-25页
4．2 估值	第25-26页
4．3 初版的实践结果及不足	第26-27页
第五章 TD强化学习法	第27-39页
5．1 TD预测	第27-28页
5．2 BP神经网络	第28-36页
5．3 TD与神经网络结合	第36-39页
第六章编程与实践结果	第39-44页
6．1 编程	第39-40页
6．2 实践结果及神经网络学习参数选择	第40-42页
6．3 讨论	第42-44页
参考文献	第44-46页
致谢	第46页