首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的路径规划方法研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第9-15页
    1.1 课题背景及研究的目的和意义第9-10页
    1.2 相关理论的发展概况第10-13页
        1.2.1 强化学习研究发展及现状第10-11页
        1.2.2 路径规划研究发展及现状第11-12页
        1.2.3 研究现状简析第12-13页
    1.3 本文的主要研究内容第13-15页
第2章 强化学习及路径规划分析第15-24页
    2.1 引言第15页
    2.2 强化学习基本原理第15-20页
        2.2.1 强化学习模型第15-17页
        2.2.2 马尔可夫决策过程第17-18页
        2.2.3 强化学习基本算法第18-20页
    2.3 路径规划基本原理第20-23页
    2.4 本章小结第23-24页
第3章 基于策略选择模型的Q-LEARNING方法第24-36页
    3.1 引言第24页
    3.2 策略选择模型第24-27页
        3.2.1 策略迭代算法第24-26页
        3.2.2 策略选择算法第26-27页
    3.3 Q-LEARNING算法第27-29页
    3.4 含有策略选择的Q-LEARNING算法第29-31页
    3.5 仿真结果及分析第31-35页
    3.6 本章小结第35-36页
第4章 基于情感元素的学习系统研究第36-52页
    4.1 引言第36页
    4.2 含有情感系统的强化学习系统第36-41页
        4.2.1 机器学习中的情感基础第36-37页
        4.2.2 情感基础强化学习系统第37-41页
    4.3 外环境机制设计第41-45页
        4.3.1 Agent的外部环境第41-42页
        4.3.2 外环境奖惩机制设计及算法第42-45页
    4.4 内环境的函数与边界参数设计第45-51页
        4.4.1 Agent的内部环境第45-47页
        4.4.2 内环境效用函数第47-49页
        4.4.3 策略选择算法的边界参数设计第49-51页
    4.5 本章小结第51-52页
第5章 基于强化学习的AGENT路径规划第52-62页
    5.1 引言第52页
    5.2 路径规划A*算法第52-55页
    5.3 A*算法改进第55-58页
    5.4 仿真结果分析第58-61页
    5.5 本章小结第61-62页
结论第62-64页
参考文献第64-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:光电编码器码盘刻线均匀性误差检测系统研究
下一篇:绍纳语词性标注器词法与转换规则的改进方法研究