基于增强学习的博弈主体的研究

摘要	第1-6页
Abstract	第6-10页
1 绪论	第10-14页
·课题的研究背景	第10-11页
·课题的研究意义	第11-12页
·论文所做的工作	第12-13页
·论文的组织结构	第13-14页
2 智能主体理论	第14-18页
·智能主体的概念	第14-15页
·智能主体的体系结构	第15-18页
·主体的基本结构	第15页
·慎思主体	第15-17页
·反应主体	第17页
·混合主体	第17-18页
3 神经网络及增强学习原理	第18-30页
·神经元模型和网络结构	第18-20页
·神经元模型	第19页
·网络结构	第19-20页
·反向传播算法	第20-23页
·反向传播算法的基本原理	第20-21页
·反向传播算法的推导	第21-23页
·增强学习的基本框架	第23-24页
·TD(λ)算法	第24-26页
·TD(λ)算法概述	第24-25页
·TD(λ)和神经网络的结合	第25-26页
·增强学习在博弈中的应用	第26-30页
·博弈训练的方式	第27-28页
·博弈训练中的探索和利用	第28-29页
·神经网络评估函数的设计	第29-30页
4 基于增强学习的中国跳棋博弈系统	第30-51页
·中国跳棋游戏的规则	第30-31页
·中国跳棋博弈系统的体系结构	第31-42页
·测试子系统	第31-33页
·机器自学习子系统	第33-36页
·人机对弈子系统	第36-42页
·棋盘的设计	第42-45页
·棋盘的模型	第42页
·关于棋盘分区的基本概念	第42-44页
·游戏运行阶段的定义	第44-45页
·博弈主体的设计	第45-49页
·博弈主体的结构	第45页
·博弈主体的智能决策	第45-46页
·博弈主体的自主学习	第46页
·博弈主体的智能决策学习模型	第46-49页
·神经网络评估学习器	第49页
·实验结果	第49-51页
5. 可改进方法的探讨	第51-56页
·问题的引入	第51-52页
·几个基本概念	第52-53页
·布阵图模型	第53-56页
6 结论	第56-57页
参考文献	第57-60页
在学研究成果	第60-61页
致谢	第61页