首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

解决强化学习中维数灾问题的方法研究

摘要第1-5页
Abstract第5-9页
第一章 引言第9-14页
   ·问题的提出第9-11页
   ·国内外研究现状第11-13页
     ·国内研究现状第11-12页
     ·国外研究现状第12-13页
   ·本文的主要工作第13-14页
   ·本文组织第14页
第二章 基础理论第14-33页
   ·强化学习简介第15-16页
   ·强化学习发展历史第16-18页
   ·强化学习原理第18-20页
   ·强化学习的主要算法第20-24页
     ·Monte Carlo 算法第20-21页
     ·TD 算法第21-23页
     ·Q-Learning 算法第23-24页
   ·强化学习发展趋势第24-26页
     ·部分感知强化学习第24-25页
     ·关系强化学习第25页
     ·分层强化学习第25-26页
   ·神经网络简介第26-27页
   ·神经网络发展历史第27-28页
   ·几种典型神经网络第28-32页
     ·BP 神经网络第28-30页
     ·Hopfield 网络第30-31页
     ·CMAC 神经网络第31-32页
   ·神经网络的发展趋势第32页
   ·本章小结第32-33页
第三章 基于启发式奖赏函数的分层强化学习第33-48页
   ·引言第33页
   ·分层强化学习发展状况第33-34页
   ·基于启发式奖赏函数的分层强化学习算法第34-41页
     ·启发式奖赏第34-35页
     ·广义的MDP第35-36页
     ·子任务的定义及最优策略第36-37页
     ·子任务的特征提取及附加奖赏函数第37-38页
     ·最优策略第38-40页
     ·基于启发式奖赏函数的分层强化学习算法第40-41页
   ·实验及结果分析第41-46页
     ·实验平台构成第42-43页
     ·任务分层第43页
     ·子任务特征提取及参数设置第43-44页
     ·结果及分析第44-46页
   ·结论第46-47页
   ·本章小结第47-48页
第四章 基于神经网络的强化学习第48-66页
   ·引言第48页
   ·泛化与函数估计第48-49页
     ·泛化第48-49页
     ·函数估计第49页
   ·神经网络在强化学习中的应用第49-50页
   ·神经网络和强化学习结合的算法:QL-BP 算法第50-56页
     ·QL-BP 算法第50-53页
     ·仿真实验第53-56页
   ·改进的QL-BP 算法第56-65页
     ·QL-BP 存在的问题及解决方法第56-57页
     ·改进的QL-BP 算法流程第57-58页
     ·仿真实验第58-65页
   ·本章小结第65-66页
第五章 总结与展望第66-68页
   ·本文工作总结第66-67页
   ·工作展望第67-68页
参考文献第68-73页
攻读硕士学位期间参加的科研项目及发表(录用)的论文第73-74页
致谢第74-75页

论文共75页,点击 下载论文
上一篇:从广告周刊到每日新闻纸--《上海新报》的历史考察
下一篇:基于串联组合增力机构的工业机械手可重构气动夹持装置