瞬时差分方法在中国象棋计算机博弈中的应用
摘要 | 第1-6页 |
Abstract | 第6-9页 |
第1章 绪论 | 第9-13页 |
·研究工作的目的与意义 | 第9-10页 |
·本课题的国内外发展现状 | 第10-12页 |
·本课题研究的主要内容 | 第12-13页 |
第2章 中国象棋计算机博弈中的关键技术 | 第13-22页 |
·局面及着法的表示 | 第13-15页 |
·搜索算法 | 第15-17页 |
·着法生成 | 第17-19页 |
·评价函数 | 第19-21页 |
·本章小结 | 第21-22页 |
第3章 将专家棋谱转化成为局面数组 | 第22-30页 |
·将专家棋谱转化成为局面数组序列 | 第23页 |
·着法拆分算法 | 第23-29页 |
·本章小结 | 第29-30页 |
第4章 增强学习与瞬时差分方法 | 第30-41页 |
·增强学习系统 | 第30-32页 |
·增强学习问题的求解方法 | 第32-35页 |
·瞬时差分学习 | 第35-40页 |
·本章小结 | 第40-41页 |
第5章 利用瞬时差分方法训练评价函数 | 第41-55页 |
·值函数V(s,w)的权值更新规则 | 第41-42页 |
·神经网络权值更新规则 | 第42-44页 |
·利用专家棋谱训练神经网络 | 第44-46页 |
·实验效果 | 第46-54页 |
·本章小结 | 第54-55页 |
第6章 结论与展望 | 第55-56页 |
参考文献 | 第56-58页 |
攻读硕士学位期间科研工作情况 | 第58-59页 |
致谢 | 第59页 |