首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于支持向量技术的Agent强化学习研究与应用

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-20页
   ·引言第11页
   ·AGENT技术概述第11-15页
     ·Agent概念第11-12页
     ·Agent属性第12-13页
     ·Agent结构第13-14页
     ·多Agent系统第14-15页
   ·ROBOCUP简介第15-18页
     ·起源及意义第15-17页
     ·RoboCup仿真组比赛第17页
     ·当前研究状况第17-18页
   ·本文结构第18-20页
第二章 基本理论第20-32页
   ·统计学习与支持向量机第20-24页
     ·统计学习理论第20-22页
     ·支持向量机第22-23页
     ·支持向量机回归第23-24页
   ·强化学习第24-28页
     ·强化学习原理第24-25页
     ·强化学习中的几个关键问题第25-26页
     ·经典的强化学习算法第26-28页
   ·多AGENT强化学习第28-30页
     ·合作型多Agent强化学习第29页
     ·竞争型多Agent强化学习第29页
     ·半竞争型多Agent强化学习第29-30页
   ·支持向量和强化学习结合技术的研究第30-31页
   ·本章小节第31-32页
第三章 支持向量回归在ROBOCUP截球技术中的应用第32-38页
   ·截球问题背景介绍第32页
   ·截球问题及其算法第32-34页
     ·截球问题第32-33页
     ·算法描述第33-34页
   ·仿真实验第34-37页
     ·评价标准第34页
     ·样本采集第34-35页
     ·学习参数的确定第35-36页
     ·实验结果第36-37页
   ·本章小结第37-38页
第四章 基于支持向量分类的强化学习模型第38-44页
   ·引言第38页
   ·基于SVM分类的强化学习系统第38-41页
     ·输入模块第39页
     ·状态划分模块第39-40页
     ·状态泛化模块第40页
     ·动作决策模块第40-41页
   ·过人问题描述以及建模第41-42页
   ·实验及其结果分析第42-43页
   ·本章小结第43-44页
第五章 结束语第44-46页
   ·本文工作总结第44页
   ·下一步工作展望第44-46页
参考文献第46-49页
参与科研项目第49页
研究生期间发表论文情况第49页

论文共49页,点击 下载论文
上一篇:核电设备供应商关系管理研究
下一篇:首钢原燃料生产物流系统合理化研究