基于支持向量技术的Agent强化学习研究与应用

摘要	第1-6页
ABSTRACT	第6-11页
第一章绪论	第11-20页
·引言	第11页
·AGENT技术概述	第11-15页
·Agent概念	第11-12页
·Agent属性	第12-13页
·Agent结构	第13-14页
·多Agent系统	第14-15页
·ROBOCUP简介	第15-18页
·起源及意义	第15-17页
·RoboCup仿真组比赛	第17页
·当前研究状况	第17-18页
·本文结构	第18-20页
第二章基本理论	第20-32页
·统计学习与支持向量机	第20-24页
·统计学习理论	第20-22页
·支持向量机	第22-23页
·支持向量机回归	第23-24页
·强化学习	第24-28页
·强化学习原理	第24-25页
·强化学习中的几个关键问题	第25-26页
·经典的强化学习算法	第26-28页
·多AGENT强化学习	第28-30页
·合作型多Agent强化学习	第29页
·竞争型多Agent强化学习	第29页
·半竞争型多Agent强化学习	第29-30页
·支持向量和强化学习结合技术的研究	第30-31页
·本章小节	第31-32页
第三章支持向量回归在ROBOCUP截球技术中的应用	第32-38页
·截球问题背景介绍	第32页
·截球问题及其算法	第32-34页
·截球问题	第32-33页
·算法描述	第33-34页
·仿真实验	第34-37页
·评价标准	第34页
·样本采集	第34-35页
·学习参数的确定	第35-36页
·实验结果	第36-37页
·本章小结	第37-38页
第四章基于支持向量分类的强化学习模型	第38-44页
·引言	第38页
·基于SVM分类的强化学习系统	第38-41页
·输入模块	第39页
·状态划分模块	第39-40页
·状态泛化模块	第40页
·动作决策模块	第40-41页
·过人问题描述以及建模	第41-42页
·实验及其结果分析	第42-43页
·本章小结	第43-44页
第五章结束语	第44-46页
·本文工作总结	第44页
·下一步工作展望	第44-46页
参考文献	第46-49页
参与科研项目	第49页
研究生期间发表论文情况	第49页