首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于Kinect深度数据辅助的机器人带噪语音识别

摘要第4-5页
abstract第5-6页
第1章 绪论第9-15页
    1.1 研究背景及意义第9-10页
    1.2 机器人带噪语音识别现状第10-12页
        1.2.1 语音增强技术的研究现状第10-11页
        1.2.2 音视频融合技术的研究现状第11-12页
        1.2.3 三维数据在语音识别中的应用第12页
    1.3 论文主要工作及贡献第12-14页
    1.4 论文章节安排第14-15页
第2章 数据采集第15-25页
    2.1 采集平台机器人NAO第15-17页
    2.2 采集工具Kinect第17-21页
        2.2.1 硬件组成第18页
        2.2.2 工作原理第18-19页
        2.2.3 深度数据第19-21页
    2.3 语料库第21-23页
        2.3.1 语料库设计第21-22页
        2.3.2 语料库采集第22-23页
    2.4 数据预处理第23-25页
        2.4.1 数据分割第23-24页
        2.4.2 音频标注第24-25页
第3章 唇区定位和侧唇重构第25-30页
    3.1 基于Kinect坐标转换的唇区定位第25-27页
        3.1.1 Kinect坐标转换第25-26页
        3.1.2 嘴唇区域投影定位第26-27页
    3.2 3D数据重构侧唇第27-30页
第4章 特征提取第30-36页
    4.1 图像信息的特征提取第30-33页
        4.1.1 DCT和PCA相结合方法第30-32页
        4.1.2 线性插值匹配方法第32页
        4.1.3 归一化第32页
        4.1.4 基于帧间距离的动态特征提取第32-33页
    4.2 音频特征提取第33-36页
第5章 基于多流HMM的音视频信息融合方法第36-48页
    5.1 HMM模型第36-45页
        5.1.1 HMM的原理第36-37页
        5.1.2 HMM的结构第37-38页
        5.1.3 HMM的应用算法第38-39页
        5.1.4 孤立词语音识别模型第39-45页
    5.2 特征融合策略第45-46页
    5.3 决策融合策略第46-48页
第6章 实验结果及分析第48-55页
    6.1 实验条件第48-49页
    6.2 重构侧唇的实验结果第49页
    6.3 深度信息辅助视觉信息的实验结果及分析第49-50页
    6.4 深度信息辅助音视频语音识别的实验结果及分析第50-55页
        6.4.1 基于特征融合的实验结果及分析第50-52页
        6.4.2 基于决策融合的实验结果及分析第52-55页
第7章 总结与展望第55-57页
    7.1 研究总结第55页
    7.2 后续工作展望第55-57页
参考文献第57-61页
发表论文和参加科研情况说明第61-62页
致谢第62-63页

论文共63页,点击 下载论文
上一篇:云环境下无线多媒体社交网络的带宽分配研究
下一篇:水下传感器网络基于节点移动性模型的路由协议设计