首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于增强学习的博弈主体的研究

摘要第1-6页
Abstract第6-10页
1 绪论第10-14页
   ·课题的研究背景第10-11页
   ·课题的研究意义第11-12页
   ·论文所做的工作第12-13页
   ·论文的组织结构第13-14页
2 智能主体理论第14-18页
   ·智能主体的概念第14-15页
   ·智能主体的体系结构第15-18页
     ·主体的基本结构第15页
     ·慎思主体第15-17页
     ·反应主体第17页
     ·混合主体第17-18页
3 神经网络及增强学习原理第18-30页
   ·神经元模型和网络结构第18-20页
     ·神经元模型第19页
     ·网络结构第19-20页
   ·反向传播算法第20-23页
     ·反向传播算法的基本原理第20-21页
     ·反向传播算法的推导第21-23页
   ·增强学习的基本框架第23-24页
   ·TD(λ)算法第24-26页
     ·TD(λ)算法概述第24-25页
     ·TD(λ)和神经网络的结合第25-26页
   ·增强学习在博弈中的应用第26-30页
     ·博弈训练的方式第27-28页
     ·博弈训练中的探索和利用第28-29页
     ·神经网络评估函数的设计第29-30页
4 基于增强学习的中国跳棋博弈系统第30-51页
   ·中国跳棋游戏的规则第30-31页
   ·中国跳棋博弈系统的体系结构第31-42页
     ·测试子系统第31-33页
     ·机器自学习子系统第33-36页
     ·人机对弈子系统第36-42页
   ·棋盘的设计第42-45页
     ·棋盘的模型第42页
     ·关于棋盘分区的基本概念第42-44页
     ·游戏运行阶段的定义第44-45页
   ·博弈主体的设计第45-49页
     ·博弈主体的结构第45页
     ·博弈主体的智能决策第45-46页
     ·博弈主体的自主学习第46页
     ·博弈主体的智能决策学习模型第46-49页
     ·神经网络评估学习器第49页
   ·实验结果第49-51页
5. 可改进方法的探讨第51-56页
   ·问题的引入第51-52页
   ·几个基本概念第52-53页
   ·布阵图模型第53-56页
6 结论第56-57页
参考文献第57-60页
在学研究成果第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:企业商业模式创新研究
下一篇:综放开采采空区液氮降温防灭火数值模拟研究