首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的面向聋哑人多源声音识别算法研究

摘要第5-6页
ABSTRACT第6-7页
缩略语对照表第11-15页
第一章 绪论第15-21页
    1.1 课题研究背景第15-16页
    1.2 研究现状第16-18页
        1.2.1 移动设备上的音频传感应用第16页
        1.2.2 环境无关的音频传感第16-17页
        1.2.3 深度学习移动音频传感第17页
        1.2.4 多源数据处理第17-18页
    1.3 研究目标和研究内容第18页
    1.4 论文各章节安排第18-21页
第二章 相关技术第21-29页
    2.1 深度学习综述第21-24页
        2.1.1 卷积神经网络(CNN)第21-22页
        2.1.2 布尔曼滋机第22-24页
    2.2 语音信号特征提取第24-25页
        2.2.1 线性预测系数第24-25页
        2.2.2 梅尔倒谱系数第25页
    2.3 Theano简介第25-26页
    2.4 GPU简介第26-29页
第三章 方案设计第29-31页
    3.1 问题描述第29-30页
    3.2 方案设计第30-31页
第四章 语音特征提取第31-39页
    4.1 MFCC流程简介第31页
    4.2 预加重第31-32页
    4.3 加窗第32-34页
    4.4 离散傅立叶变换第34页
    4.5 梅尔滤波带宽第34-35页
    4.6 倒谱:逆离散傅立叶变换第35-36页
    4.7 能量转换第36-37页
    4.8 本章小结第37-39页
第五章 多源数据识别模型第39-59页
    5.1 监督化的多源声音识别模型第39-48页
        5.1.1 卷积层第40-43页
        5.1.2 池化层第43-45页
        5.1.3 全连接层第45-46页
        5.1.4 信息遗失(Dropout)第46-48页
    5.2 基于卷积神经网络的模型压缩第48-51页
        5.2.1 压缩策略第49-50页
        5.2.2 压缩算法第50-51页
    5.3 半监督式多源声音音识别模型第51-57页
        5.3.1 限制布尔曼滋机第52-54页
        5.3.2 训练算法第54-55页
        5.3.3 分类算法第55-57页
    5.4 本章小结第57-59页
第六章 测试与结果分析第59-75页
    6.1 实验环境第59-60页
    6.2 数据处理第60-62页
        6.2.1 数据收集第60-61页
        6.2.2 数据预处理第61-62页
    6.3 实验结果第62-73页
        6.3.1 识别准确率和同类算法比较第62-63页
        6.3.2 混淆矩阵第63-65页
        6.3.3 模型压缩率第65-67页
        6.3.4 抗噪能力第67-68页
        6.3.5 训练次数第68-70页
        6.3.6 MFCC滤波数第70-72页
        6.3.7 环境无关性第72-73页
    6.4 本章小结第73-75页
第七章 总结与展望第75-77页
    7.1 本文总结第75页
    7.2 未来展望第75-77页
参考文献第77-83页
致谢第83-85页
作者简介第85-86页

论文共86页,点击 下载论文
上一篇:基于iOS的性能监控和用户操作行为分析研究
下一篇:面向流程挖掘的事件日志融合研究与应用