首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--人工神经网络与计算论文

基于强化学习的模糊神经网络控制研究及应用

中文摘要第1页
英文摘要第3-6页
第一章 绪论第6-16页
   ·研究背景及意义第6-8页
   ·模糊神经网络第8-11页
     ·模糊神经网络的发展及现状第8-10页
     ·模糊神经网络的发展前景第10-11页
   ·强化学习第11-14页
     ·强化学习的发展及现状第11-13页
     ·强化学习的研究进展及有待解决的问题第13-14页
   ·论文主要工作内容及结构安排第14-16页
第二章 强化学习第16-31页
   ·强化学习的特点第16-17页
   ·马尔可夫决策过程模型(MDP)第17-19页
   ·动态规划(Dynamic Programming)法第19-20页
   ·蒙特卡洛算法(Monte Carlo)第20-21页
   ·即时差分学习 TD(Temporal Difference Learning)第21-24页
   ·Q学习算法第24-26页
     ·Q学习算法的迭代公式第24-26页
     ·Q学习的动作选择机制第26页
   ·自适应启发评价算法(Adaptive heuristic critic algorithm)第26-29页
     ·离散动作 AHC算法(The AHC algorithm for discrete actions)第27-28页
     ·连续动作的 AHC算法(The AHC algorithms for continuous actions)第28-29页
   ·Sarsa算法第29页
   ·Dyna算法第29-30页
   ·本章小结第30-31页
第三章 模糊神经网络第31-50页
   ·模糊推理的理论基础第31-32页
     ·模糊集合第31页
     ·模糊关系第31-32页
       ·模糊关系的定义第31-32页
       ·模糊关系的运算第32页
     ·隶属函数的建立第32页
   ·模糊推理第32-34页
     ·模糊条件语句第32-33页
     ·模糊推理系统第33-34页
   ·模糊逻辑控制系统第34-37页
     ·模糊逻辑控制第34-35页
     ·模糊系统模型第35-37页
   ·神经网络理论基础第37-42页
     ·人工神经元模型第38页
     ·神经网络的学习方法第38-40页
       ·学习机理第38-39页
       ·学习方法(训练方法)第39页
       ·学习规则第39-40页
     ·多层前向神经网络模型第40-42页
       ·BP算法的原理第40-41页
       ·BP算法的数学表达第41-42页
   ·模糊神经网络理论基础第42-47页
     ·神经网络与模糊系统的比较第42-43页
     ·神经网络与模糊技术的融合第43页
     ·模糊神经网络的结构与算法第43-45页
     ·模糊神经网络控制器的学习算法第45-47页
   ·模糊神经网络结构优化的两种方法第47-49页
     ·自组织竞争神经网络第47-48页
     ·模糊C-平均法第48-49页
   ·本章小结第49-50页
第四章 基于强化学习的动态模糊神经网络控制第50-63页
   ·引言第50页
   ·模糊神经网络的结构辨识第50-51页
   ·基于强化学习的动态模糊神经网络控制第51-54页
     ·模糊控制规则的产生第51-53页
       ·ε-Completeness准则第51-52页
       ·时间差分偏差标准第52-53页
     ·修剪不满意和冗余的规则第53-54页
   ·模糊隶属函数的修改第54页
   ·实验仿真第54-62页
   ·本章小结第62-63页
第五章 结论与展望第63-65页
参考文献第65-69页
致谢第69-70页
在学校期间发表论文及参加科研情况第70页

论文共70页,点击 下载论文
上一篇:坤宝颗粒治疗更年期综合征的药理作用及机制研究
下一篇:我国推出股指期货的影响及规则探讨