首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的仿人机器人步行控制研究与实现

摘要第5-6页
Abstract第6页
第1章 绪论第10-17页
    1.1 引言第10-11页
    1.2 仿人机器人研究历史与现状第11-14页
    1.3 仿人机器人研究意义第14-15页
    1.4 本课题主要工作第15-16页
    1.5 本课题组织结构第16-17页
第2章 仿人机器人步行研究第17-32页
    2.1 仿人机器人双足步行理论回顾第17页
    2.2 静态步行模型第17-18页
    2.3 动态步行模型第18-19页
    2.4 ZMP理论第19-21页
    2.5 倒立摆模型第21-22页
    2.6 基于3维倒立摆模型及ZMP理论的离线步态产生方法第22-30页
        2.6.1 简化的仿人机器人行走模型第22-23页
        2.6.23维倒立摆模型及ZMP分析第23-27页
        2.6.3 仿人机器人运行学分析第27-30页
        2.6.4 离线轨迹关键帧提取第30页
    2.7 本章小结第30-32页
第3章 基于RBF网络的Q学习框架第32-55页
    3.1 强化学习第32-36页
        3.1.1 Actor-Critic第33页
        3.1.2 TD学习第33页
        3.1.3 Eligibility Traces第33-34页
        3.1.4 Q学习第34页
        3.1.5 TD学习和Q学习在连续状态行为空间上的实现第34-36页
    3.2 神经网络第36-41页
        3.2.1 基本结构第36-38页
        3.2.2 BP算法第38-39页
        3.2.3 RBF网络第39-41页
    3.3 基于RBF网络的Q学习框架 (RBF-Q Learning)设计第41-53页
        3.3.1 RBF-Q Learning算法简要描述第41-42页
        3.3.2 RBF网络拟合的Q函数第42-44页
        3.3.3 梯度下降法求解下一步行为第44-45页
        3.3.4 RBF-Q Learning算法框架第45-47页
        3.3.5 基于RBF-Q Learning框架的自适应PID控制器第47-53页
    3.4 本章小结第53-55页
第4章 The Vitruvian Man仿人机器人平台第55-62页
    4.1 仿人机器人平台机械结构第55-56页
    4.2 仿人机器人平台Webots仿真模型第56-57页
    4.3 仿人机器人硬件平台架构第57-60页
    4.4 仿人机器人软件平台架构第60-61页
    4.5本章小结第61-62页
第5章 基于强化学习的仿人机器人步行稳定控制第62-76页
    5.1 不平整地面上的步行第62页
    5.2 基于传感器反馈信息的稳定控制第62-63页
    5.3 传感器信息及姿态第63-68页
        5.3.1 加速度传感器第63-64页
        5.3.2 陀螺仪(角速度传感器)第64页
        5.3.3 仿人机器人姿态估计第64-68页
    5.4 基于RBF-Q Learning框架的自适应PID步行稳定控制器第68-70页
        5.4.1 基于RBF-Q Learning框架的自适应PID稳定控制器结构第68-70页
        5.4.2 基于RBF-Q Learning框架的自适应PID稳定控制流程第70页
    5.5 基于RBF-Q Learning框架的强化学习步行稳定控制器第70-75页
        5.5.1 基于RBF-Q Learning框架的步行稳定控制器结构第71-74页
        5.5.2 基于RBF-Q Learning框架的步行稳定控制流程第74-75页
    5.6 本章小结第75-76页
第6章 实验及结果第76-91页
    6.1 仿真实验第76-87页
        6.1.1 实验环境第76-78页
        6.1.2 实验过程第78-81页
        6.1.3 结果分析第81-87页
        6.1.4 实验总结第87页
    6.2 向实体机器人上的迁移第87-89页
        6.2.1 实体环境上所面临的问题第88-89页
        6.2.2 实体机器人行走结果第89页
        6.2.3 实验总结第89页
    6.3 本章小结第89-91页
结论第91-93页
参考文献第93-97页
攻读硕士学位期间取得的研究成果第97-98页
致谢第98-99页
附件第99页

论文共99页,点击 下载论文
上一篇:人机协作中机器人主动避碰技术研究
下一篇:视觉引导AGV车载运动控制系统开发