摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第1章 绪论 | 第10-16页 |
·课题研究背景及意义 | 第10页 |
·活套控制系统的研究及发展状况 | 第10-13页 |
·活套器类型 | 第10-11页 |
·活套控制系统的发展状况 | 第11-13页 |
·ADP在线学习算法的特点及研究现状 | 第13-14页 |
·论文的主要工作 | 第14-16页 |
第2章 ADP在线学习算法的理论基础 | 第16-33页 |
·人工神经网络(Artificial Neural Networks)简介 | 第16-20页 |
·BP神经网络的结构 | 第16-17页 |
·BP模型的计算公式 | 第17-18页 |
·BP算法的实现 | 第18页 |
·BP神经网络的局限性 | 第18-19页 |
·BP神经网络的优化 | 第19-20页 |
·序贯优化决策问题 | 第20页 |
·Markov决策过程(Markov Decision Process) | 第20-24页 |
·Markov决策过程的分类 | 第21页 |
·Markov决策过程的数学模型 | 第21-24页 |
·强化学习(Reinforcement Learning) | 第24-29页 |
·强化学习的模型和原理 | 第24-25页 |
·强化学习算法 | 第25-29页 |
·动态规划DP(Dynamic Programming) | 第29-31页 |
·动态规划DP(Dynamic Programming)模型的分类 | 第30页 |
·离散动态规划 | 第30页 |
·动态规划的多级决策 | 第30-31页 |
·动态规划的特点 | 第31页 |
·本章小结 | 第31-33页 |
第3章 ADP在线学习算法介绍 | 第33-48页 |
·自适应动态规划(ADP)来源及应用研究发展 | 第34-35页 |
·自适应动态规划(ADP)的原理和特点 | 第35-36页 |
·自适应动态规划ADP的模型 | 第36-47页 |
·启发式动态规划(Heuristic Dynamic Programming,HDP) | 第37-40页 |
·对偶启发式规划(Dual Heuristic Programming,DHP) | 第40-41页 |
·全局化对偶启发式规划(Globalized Dual Heuristic Programming,GDHP | 第41-42页 |
·执行依赖启发式动态规划(Action-dependent Heuristic DynamicProgramming,ADHDP) | 第42-43页 |
·执行依赖对偶启发式规划(Action-dependent Dual HeuristicProgramming,ADDHP) | 第43-45页 |
·执行依赖全局化对偶启发式规划(Action Dependent Globalized DualHeuristic Programming,ADGDHP) | 第45-47页 |
·本章小结 | 第47-48页 |
第4章 基于ADHDP的液压活套控制应用 | 第48-63页 |
·ADHDP在线控制模型的设计 | 第48-52页 |
·评价网络(CNN)设计 | 第49-50页 |
·执行网络(ANN)设计 | 第50-52页 |
·归一化(正规化)处理 | 第52页 |
·液压活套控制系统数学模型 | 第52-59页 |
·液压活套高度(活套量)计算 | 第53-54页 |
·液压活套力矩计算 | 第54页 |
·活套的套量控制 | 第54-55页 |
·活套的力矩控制 | 第55-56页 |
·活套控制模型 | 第56-59页 |
·基于ADHDP的液压活套控制模型仿真 | 第59-62页 |
·本章小结 | 第62-63页 |
第5章 总结与展望 | 第63-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-69页 |
作者攻读硕士期间发表的论文及参与科研情况 | 第69页 |