首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于强化学习的路径规划问题研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-15页
    1.1 课题背景及研究的目的和意义第9-10页
    1.2 课题相关领域研究现状第10-14页
        1.2.1 路径规划方法研究现状第10-12页
        1.2.2 探索利用平衡问题研究现状第12-13页
        1.2.3 路径规划问题的难点第13-14页
    1.3 论文内容及组织结构第14-15页
第2章 路径规划方法及强化学习算法第15-31页
    2.1 引言第15页
    2.2 传统路径规划算法第15-20页
        2.2.1 组合式规划第15-18页
        2.2.2 采样式规划第18-20页
    2.3 强化学习算法第20-30页
        2.3.1 强化学习基本框架第20-22页
        2.3.2 强化学习典型方法第22-30页
    2.4 本章小结第30-31页
第3章 基于时间差分方法的路径规划第31-44页
    3.1 引言第31-32页
    3.2 基于时间差分的路径规划第32-38页
        3.2.1 时间差分法基本思想第32-35页
        3.2.2 SARSA和Q-learning第35-38页
    3.3 基于成功率的探索方法第38-41页
        3.3.1 探索与利用平衡问题第39-40页
        3.3.2 动态调整探索因子第40-41页
    3.4 基于成功率的探索方法与时间差分法的结合第41-43页
    3.5 本章小结第43-44页
第4章 仿真实验及结果分析第44-59页
    4.1 引言第44页
    4.2 仿真实验说明第44-46页
    4.3 实验结果及分析第46-58页
        4.3.1 无模型方法在路径规划中的实验第46-52页
        4.3.2 基于成功率的探索方法的Q(γ)-learning第52-58页
    4.4 本章小结第58-59页
结论第59-60页
参考文献第60-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:基于内存计算的基因型—表型关联技术研究
下一篇:基于补偿函数的Spark容错机制优化