首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

半Markov决策过程强化学习算法研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-14页
    1.1 课题背景和意义第8-10页
    1.2 国内外研究现状第10-13页
        1.2.1 表格型强化学习第10-11页
        1.2.2 近似型强化学习第11-12页
        1.2.3 分层强化学习第12页
        1.2.4 探索和利用平衡型强化学习第12-13页
    1.3 主要研究内容第13-14页
第2章 马氏过程和半马氏过程第14-23页
    2.1 马尔可夫决策过程第14-18页
    2.2 半马尔可夫决策过程第18-22页
    2.3 本章小结第22-23页
第3章 基于性能灵敏度分析的强化学习第23-41页
    3.1 马氏无模型强化学习研究第23-29页
        3.1.1 马氏无模型强化学习算法第23-26页
        3.1.2 基于四环马氏过程的仿真实验第26-29页
    3.2 性能灵敏度分析方法第29-31页
    3.3 半马氏无模型强化学习研究第31-40页
        3.3.1 半马氏无模型强化学习算法第32-36页
        3.3.2 基于三状态半马氏过程的仿真实验第36-40页
    3.4 本章小结第40-41页
第4章 半马氏强化学习算法比较研究第41-56页
    4.1 增量值迭代强化学习第41-49页
        4.1.1 增量值迭代强化学习算法第41-44页
        4.1.2 三状态半马氏过程实验仿真结果第44-46页
        4.1.3 无人车实验仿真结果第46-49页
    4.2 随机最短路值迭代强化学习第49-55页
        4.2.1 随机最短路值迭代强化学习算法第50-52页
        4.2.2 三状态半马氏过程实验仿真结果第52-53页
        4.2.3 无人车实验仿真结果第53-55页
    4.3 本章小结第55-56页
结论第56-58页
参考文献第58-62页
攻读硕士学位期间发表的论文及其它成果第62-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:面向3C拾放应用的码垛机器人机构优化设计研究
下一篇:基于视觉-里程计融合的移动机器人定位算法研究