首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

深度自编码网络特征提取实现基于超声的无声语音识别

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-12页
    1.1 课题背景第8-9页
    1.2 研究现状第9-10页
    1.3 论文创新工作第10页
    1.4 论文结构第10-12页
第2章 相关背景综述第12-26页
    2.1 无声语音接口第12-14页
        2.1.1 电磁发音仪EMA第12-13页
        2.1.2 表面肌电信号传感器surface EMG(sEMG)第13-14页
        2.1.3 超声和光学成像第14页
    2.2 语音识别第14-19页
        2.2.1 语音识别的历史和发展现状第14-16页
        2.2.2 语音识别过程第16-19页
    2.3 深度神经网络(DNN)第19-23页
        2.3.1 神经网络的历史和发展现状第19-21页
        2.3.2 DNN在语音识别中的应用第21-23页
    2.4 本章小结第23-26页
第3章 无声语音识别系统第26-44页
    3.1 数据采集第26-32页
        3.1.1 图像数据采集设备简介第26-30页
        3.1.2 TIMIT语料库第30-31页
        3.1.3 数据采集规则第31-32页
    3.2 非声学特征提取第32-41页
        3.2.1 图像特征提取方法简介第32-36页
        3.2.2 基于自编码网络的特征提取第36-41页
    3.3 无声语音识别第41-42页
    3.4 本章小结第42-44页
第4章 实验与分析第44-58页
    4.1 数据集第44页
    4.2 特征提取第44-49页
        4.2.1 图像预处理第45页
        4.2.2 DAE网络训练第45-47页
        4.2.3 结果及分析第47-49页
    4.3 无声语音识别第49-55页
        4.3.1 Kaldi语音识别工具箱第49页
        4.3.2 数据准备第49-51页
        4.3.3 DNN-HMM训练第51-53页
        4.3.4 识别结果分析第53-55页
    4.4 本章小结第55-58页
第5章 网络参数对模型训练的影响第58-64页
    5.1 DAE训练迭代次数对图像重构的影响第58-60页
    5.2 高斯数对单音素模型的影响第60-61页
    5.3 回归树叶节点数和高斯数对三音素模型的影响第61-62页
    5.4 DNN训练层数和隐层节点数对识别结果的影响第62-63页
    5.5 本章小结第63-64页
第6章 总结与展望第64-66页
    6.1 总结第64-65页
    6.2 展望第65-66页
参考文献第66-70页
发表论文和参加科研情况说明第70-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:基于Teamcenter的数字化装配工艺系统研究
下一篇:基于OFDM自适应调制的低压电力线通信系统的研究