首页--航空、航天论文--航空论文--各类型航空器论文--无人驾驶飞机论文

基于强化学习的无人机空中格斗算法研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-19页
    1.1 课题研究背景第8-13页
    1.2 国内外研究现状第13-17页
        1.2.1 空战决策理论研究现状第13-15页
        1.2.2 强化学习研究现状第15-17页
    1.3 本文的主要研究内容第17-19页
第2章 强化学习理论第19-36页
    2.1 强化学习及其理论基础第19-25页
        2.1.1 马尔科夫决策过程模型第19-21页
        2.1.2 强化学习的基本原理及模型第21-23页
        2.1.3 强化学习的组成要素第23-25页
    2.2 典型强化学习模型第25-33页
        2.2.1 强化学习算法的目的第25-26页
        2.2.2 瞬时差分算法第26-29页
        2.2.3 Q学习算法第29-30页
        2.2.4 Sarsa算法第30页
        2.2.5 自适应启发评价算法第30-32页
        2.2.6 分层强化学习第32-33页
    2.3 强化学习的应用领域第33-35页
        2.3.1 优化控制中应用第33-34页
        2.3.2 机器人领域的应用第34页
        2.3.3 调度控制领域的应用第34-35页
        2.3.4 人工智能问题求解中的应用第35页
    2.4 本章小结第35-36页
第3章 基于动机引导的强化学习算法研究第36-43页
    3.1 动机引导强化学习第36-38页
        3.1.1 基本思想第36-37页
        3.1.2 算法描述第37-38页
    3.2 基于模拟退火的动机引导强化学习第38-39页
        3.2.1 基本思想第38页
        3.2.2 算法描述第38-39页
    3.3 实验设计及结果分析第39-42页
        3.3.1 实验环境第39-41页
        3.3.2 实验参数设置第41页
        3.3.3 结果分析第41-42页
    3.4 本章小结第42-43页
第4章 基于强化学习的无人机格斗算法研究第43-56页
    4.1 引言第43-44页
    4.2 无人机格斗环境描述第44-50页
        4.2.1 系统的状态和输入第44-45页
        4.2.2 动机与可选动作集合第45-48页
        4.2.3 目标状态和回报函数的定义第48-50页
    4.3 基于强化学习的无人机格斗算法设计第50-53页
        4.3.1 网络结构设计第50-51页
        4.3.2 神经网络训练第51-52页
        4.3.3 生成训练样本第52页
        4.3.4 算法步骤第52-53页
    4.4 结果分析第53-54页
    4.5 本章小结第54-56页
结论第56-57页
参考文献第57-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:气浮台垂向运动气压控制研究与实现
下一篇:四旋翼飞行器姿态控制算法的研究