首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于深度强化学习的游戏博弈策略的研究与实现

摘要第4-6页
abstract第6-7页
第1章 绪论第11-16页
    1.1 课题研究背景及意义第11-14页
        1.1.1 深度学习背景第11-12页
        1.1.2 强化学习背景第12-13页
        1.1.3 游戏博弈策略第13-14页
    1.2 本文的研究内容第14页
    1.3 本文的组织结构第14-16页
第2章 深度神经网络与课程学习策略第16-32页
    2.1 深度学习背景介绍第16-21页
        2.1.1 机器学习与深度学习第16-17页
        2.1.2 深度学习的实现过程第17-21页
    2.2 神经网络第21-27页
        2.2.1 神经元与激活函数第21-23页
        2.2.2 网络的结构第23-24页
        2.2.3 反向传播算法第24-27页
    2.3 卷积神经网络第27-30页
        2.3.1 网络的结构第27-28页
        2.3.2 网络训练方法第28-30页
    2.4 课程学习策略第30-31页
    2.5 本章小结第31-32页
第3章 强化学习与TensorFlow系统第32-41页
    3.1 强化学习介绍第32-37页
        3.1.1 强化学习简介第32-34页
        3.1.2 马尔科夫决策过程第34-35页
        3.1.3 动态规划求解MDP第35-37页
        3.1.4 Q-Learning算法第37页
    3.2 TensorFlow系统介绍第37-40页
        3.2.1 TensorFlow简介第37-38页
        3.2.2 TensorFlow的基本用法第38-40页
    3.3 本章小结第40-41页
第4章 DQN算法模型建立第41-48页
    4.1 背景及主要工作第41-42页
    4.2 MDP问题建模第42-43页
    4.3 DQN算法模型第43-45页
        4.3.1 探索与利用第43-44页
        4.3.2 价值函数估计第44页
        4.3.3 DQN算法第44-45页
    4.4 网络架构设计第45-47页
    4.5 本章小结第47-48页
第5章 实验设计与结果分析第48-58页
    5.1 实验的设计与实现第48-54页
        5.1.1 研究目标第48页
        5.1.2 实验环境第48页
        5.1.3 建立游戏模型第48-49页
        5.1.4 课程学习策略第49-50页
        5.1.5 基于深度强化学习的游戏博弈策略的算法实现第50-54页
    5.2 实验结果分析第54-58页
        5.2.1 训练和稳定性第54-55页
        5.2.2 实验结果分析第55-58页
第6章 总结与展望第58-60页
参考文献第60-63页
作者简介及在学期间所取得的科研成果第63-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于双向循环神经网络的室内目的地预测的算法研究
下一篇:基于VAE的条件生成式对抗网络模型研究