基于深度强化学习的非完备信息机器博弈研究

摘要	第4-5页
ABSTRACT	第5-6页
第1章绪论	第9-15页
1.1 课题研究背景和意义	第9-11页
1.1.1 课题研究背景	第9-10页
1.1.2 研究的目的和意义	第10-11页
1.2 国内外相关研究及综述	第11-13页
1.3 主要研究内容及组织结构	第13-15页
1.3.1 主要研究内容	第13-14页
1.3.2 论文的组织结构	第14-15页
第2章非完备信息机器博弈	第15-21页
2.1 非完备信息游戏中的博弈问题	第15页
2.2 博弈树搜索	第15-17页
2.3 估值函数	第17-18页
2.3.1 静态估值函数	第17页
2.3.2 动态估值函数	第17-18页
2.4 部分可观测马尔科夫决策过程	第18-20页
2.5 本章小结	第20-21页
第3章基于深度强化学习的非完备信息机器博弈	第21-43页
3.1 深度强化学习	第21-29页
3.1.1 强化学习	第21-24页
3.1.2 深度学习	第24-25页
3.1.3 深度强化学习算法	第25-29页
3.2 改进的深度强化学习网络	第29-33页
3.3 基于蒙特卡洛博弈树搜索的回报函数	第33-37页
3.3.1 蒙特卡洛博弈树搜索	第33-35页
3.3.2 蒙特卡洛博弈树搜索应用于深度强化学习中	第35-37页
3.4 扑克游戏的模式匹配建模方法	第37-42页
3.5 本章小结	第42-43页
第4章非完备信息机器博弈系统的实现和实验分析	第43-53页
4.1 德州扑克机器博弈系统	第43-48页
4.1.1 德州扑克机器博弈系统框架	第43-45页
4.1.2 德州扑克智能体训练方式	第45-46页
4.1.3 改进的深度强化学习网络结构	第46-48页
4.2 实验结果分析	第48-52页
4.2.1 两种网络效果对比	第48-50页
4.2.2 不同梯度下降算法实验效果对比	第50页
4.2.3 改进的深度强化学习智能体与其他智能体对比	第50-52页
4.3 本章小结	第52-53页
结论	第53-55页
参考文献	第55-60页
致谢	第60页