基于3D仿真机器人系统的学习控制与算法研究

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·引言	第7页
·RoboCup 简介	第7-8页
·什么是RoboCup	第7页
·RoboCup 的研究意义	第7-8页
·RoboCup 的活动和比赛项目	第8页
·选题的背景和意义	第8-10页
·RoboCup 3D 简介	第8-9页
·Robocup3D 的国内外研究现状	第9页
·江南大学Robocup3D 代表队的现状	第9页
·Robocup3D 的研究意义	第9-10页
·本文的研究目标	第10-11页
第二章 Robocup3D 仿真系统的研究	第11-23页
·仿真服务器的组成及工作原理	第11-13页
·仿真服务器的组成	第11-12页
·仿真服务器的工作流程	第12-13页
·开放式动力学引擎(open dynamics engine)	第13页
·裁判系统	第13页
·比赛环境信息	第13-17页
·场地信息	第13-14页
·球员物理模型	第14-17页
·球员感知信息的方式	第17-19页
·身体感知器	第17-18页
·足球感知器	第18-19页
·智能体的执行指令	第19-21页
·仿真通用指令	第20页
·足球仿真专用指令	第20-21页
·本章小结	第21-23页
第三章 AFU2010 的体系结构	第23-31页
·Agent 的定义与分类	第23-25页
·Agent 的定义	第23页
·Agent 的分类	第23-24页
·多Agent 系统	第24-25页
·AFU2010 的总体框架	第25-27页
·底层	第27页
·技术层	第27页
·决策层	第27页
·其他部分	第27页
·AFU2010 功能模块的划分	第27-29页
·通讯模块	第28页
·解析消息模块	第28页
·世界模型模块	第28页
·决策模块	第28-29页
·动作技能模块	第29页
·本章小结	第29-31页
第四章球员技能的实现	第31-49页
·机器人的定位算法	第31-35页
·标杆定位法	第31-33页
·定位精度的提高	第33-35页
·球员的跌倒-起身算法	第35-36页
·截球的决策算法	第36-38页
·球员行走的决策算法	第38-47页
·行走过程中的运动学分析	第38-40页
·行走过程关节建模	第40-43页
·仿真结果	第43-47页
·本章小结	第47-49页
第五章球员射门技术的学习	第49-57页
·强化学习	第49-52页
·强化学习的组成要素和特点	第49-51页
·Q 学习	第51-52页
·学习技术在球员射门中的应用	第52-55页
·学习模式的选择	第52-53页
·模型的离散化	第53-54页
·学习过程	第54页
·实验结果分析	第54-55页
·其他策略的学习	第55-56页
·个体策略的学习	第55页
·球队策略的学习	第55-56页
·本章小结	第56-57页
第六章总结与展望	第57-59页
·结论	第57页
·展望	第57-59页
致谢	第59-61页
参考文献	第61-65页
附录:攻读硕士学位期间发表的论文和比赛成绩	第65页