首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文--智能机器人论文

基于增强学习的足球机器人行为控制研究

摘要第1-9页
ABSTRACT第9-11页
第一章 绪论第11-18页
   ·课题研究背景和意义第11-14页
   ·课题研究现状和发展趋势第14-16页
   ·课题研究的主要内容第16-18页
第二章 增强学习及其结构模型实现方法研究第18-30页
   ·Markov 决策过程与增强学习第18-20页
     ·Markov 决策过程第18-19页
     ·增强学习模型第19-20页
   ·增强学习基本算法第20-23页
   ·分层式增强学习第23-26页
     ·半马氏决策过程第23-24页
     ·分层与抽象第24-26页
   ·增强学习结构模型实现平台及方法研究第26-29页
     ·NuBot 足球机器人行为控制体系结构第26-27页
     ·基于实体机器人的增强学习结构模型实现第27-29页
   ·小结第29-30页
第三章 基于值函数增强学习的机器人行为控制算法研究第30-46页
   ·基于CMAC 的Sarsa 直接梯度增强学习算法第30-32页
     ·CMAC 的结构第30-31页
     ·基于CMAC 的Sarsa(λ)-学习直接梯度增强学习算法第31-32页
   ·基于CMAC 的Sarsa(λ)增强学习算法在机器人行为控制中的应用第32-36页
     ·截球问题的Markov 建模描述第32-34页
     ·仿真实验结果及其分析第34-36页
   ·基于三角剖分的CMAC 在机器人行为控制中的应用第36-42页
     ·基于三角剖分的CMAC 神经网络第36-37页
     ·基于TRI-CMAC 的增强学习控制器在截球问题中的应用第37-40页
     ·基于TRI-CMAC 的增强学习控制器在避障问题中的应用第40-42页
   ·启发式信息在机器人行为控制中的应用第42-44页
   ·小结第44-46页
第四章 基于分层式增强学习的机器人行为控制算法研究第46-59页
   ·基于Sarsa(λ)的分层式增强学习机制第46-49页
   ·基于CMAC 的分层式增强学习在机器人行为控制中的应用第49-54页
     ·多任务环境问题及其分层描述第49-52页
     ·基于CMAC 神经网络的分层式增强学习框架设计第52-54页
   ·实验结果及其分析第54-58页
     ·高层Agent 与低层Agent 同步学习第55-56页
     ·高层Agent 与低层Agent 异步学习第56-58页
   ·小结第58-59页
第五章 结论与展望第59-61页
   ·研究工作总结第59-60页
   ·未来工作展望第60-61页
致谢第61-62页
参考文献第62-66页
作者在学期间取得的学术成果第66页

论文共66页,点击 下载论文
上一篇:基于ZigBee的智能火灾报警系统设计
下一篇:基于HSMM的滚动轴承故障预测技术