关系强化学习的研究与应用

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-14页
·研究背景	第9-11页
·强化学习的发展	第11-12页
·本文主要研究内容	第12-14页
第二章强化学习	第14-25页
·强化学习模型	第14-17页
·值迭代	第15-16页
·策略迭代	第16页
·改进的值迭代和策略迭代	第16-17页
·无模型的策略学习	第17-19页
·TD 算法	第17-18页
·Q 学习算法	第18-19页
·基于模型的策略学习	第19-21页
·DYNA 算法	第19-20页
·优先扫描序列	第20-21页
·大状态空间问题的解决方法	第21-24页
·近似技术	第22页
·分层技术	第22页
·因素化表述技术	第22-24页
·其他抽象技术	第24页
·本章小结	第24-25页
第三章关系强化学习的研究与改进	第25-41页
·研究关系强化学习的必要性	第25-26页
·关系型MDP	第26-28页
·关系的表述	第26-27页
·逻辑抽象和分割	第27-28页
·一阶逻辑谓词决策树的构建	第28-32页
·一般决策树的构建	第28-30页
·逻辑决策树的构建	第30-32页
·逻辑树和Q 算法的结合	第32-35页
·改进的关系型强化学习	第35-39页
·原算法缺点分析	第35-36页
·增量算法改进	第36页
·候选谓词算法改进	第36-39页
·对比实验及算法分析	第39-40页
·固定积木实验	第39-40页
·变化积木实验	第40页
·本章小结	第40-41页
第四章基于强化学习的自主驾驶系统	第41-53页
·智能车概述	第41-42页
·智能车避障模型	第42-44页
·各模块研究	第44-48页
·状态分析模块	第44-47页
·知识库系统	第47-48页
·实验	第48-52页
·实验设置	第48-50页
·实验及结果分析	第50-52页
·本章小结	第52-53页
第五章结论与展望	第53-54页
·结论	第53页
·进一步工作	第53-54页
参考文献	第54-58页
致谢	第58-59页
附录(攻读硕士学位期间发表论文及参与的科研项目)	第59页