摘要 | 第1-9页 |
ABSTRACT | 第9-11页 |
第一章 绪论 | 第11-18页 |
·课题研究背景和意义 | 第11-14页 |
·课题研究现状和发展趋势 | 第14-16页 |
·课题研究的主要内容 | 第16-18页 |
第二章 增强学习及其结构模型实现方法研究 | 第18-30页 |
·Markov 决策过程与增强学习 | 第18-20页 |
·Markov 决策过程 | 第18-19页 |
·增强学习模型 | 第19-20页 |
·增强学习基本算法 | 第20-23页 |
·分层式增强学习 | 第23-26页 |
·半马氏决策过程 | 第23-24页 |
·分层与抽象 | 第24-26页 |
·增强学习结构模型实现平台及方法研究 | 第26-29页 |
·NuBot 足球机器人行为控制体系结构 | 第26-27页 |
·基于实体机器人的增强学习结构模型实现 | 第27-29页 |
·小结 | 第29-30页 |
第三章 基于值函数增强学习的机器人行为控制算法研究 | 第30-46页 |
·基于CMAC 的Sarsa 直接梯度增强学习算法 | 第30-32页 |
·CMAC 的结构 | 第30-31页 |
·基于CMAC 的Sarsa(λ)-学习直接梯度增强学习算法 | 第31-32页 |
·基于CMAC 的Sarsa(λ)增强学习算法在机器人行为控制中的应用 | 第32-36页 |
·截球问题的Markov 建模描述 | 第32-34页 |
·仿真实验结果及其分析 | 第34-36页 |
·基于三角剖分的CMAC 在机器人行为控制中的应用 | 第36-42页 |
·基于三角剖分的CMAC 神经网络 | 第36-37页 |
·基于TRI-CMAC 的增强学习控制器在截球问题中的应用 | 第37-40页 |
·基于TRI-CMAC 的增强学习控制器在避障问题中的应用 | 第40-42页 |
·启发式信息在机器人行为控制中的应用 | 第42-44页 |
·小结 | 第44-46页 |
第四章 基于分层式增强学习的机器人行为控制算法研究 | 第46-59页 |
·基于Sarsa(λ)的分层式增强学习机制 | 第46-49页 |
·基于CMAC 的分层式增强学习在机器人行为控制中的应用 | 第49-54页 |
·多任务环境问题及其分层描述 | 第49-52页 |
·基于CMAC 神经网络的分层式增强学习框架设计 | 第52-54页 |
·实验结果及其分析 | 第54-58页 |
·高层Agent 与低层Agent 同步学习 | 第55-56页 |
·高层Agent 与低层Agent 异步学习 | 第56-58页 |
·小结 | 第58-59页 |
第五章 结论与展望 | 第59-61页 |
·研究工作总结 | 第59-60页 |
·未来工作展望 | 第60-61页 |
致谢 | 第61-62页 |
参考文献 | 第62-66页 |
作者在学期间取得的学术成果 | 第66页 |