首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于DNN的语言识别系统的研究与实现

摘要第5-6页
abstract第6-7页
第一章 绪论第10-20页
    1.1 选题背景第10-11页
    1.2 国内外研究状况第11-17页
    1.3 论文主要研究内容及组织结构第17-20页
        1.3.1 论文主要研究内容第17-18页
        1.3.2 论文组织结构第18-20页
第二章 相关技术介绍第20-29页
    2.1 神经网络基础第20-25页
        2.1.1 神经网络的基本结构第20-21页
        2.1.2 梯度下降方法第21-23页
        2.1.3 误差反向传播算法第23-25页
    2.2 KALDI开源系统第25-28页
    2.3 本章小结第28-29页
第三章 需求分析第29-39页
    3.1 系统实现目标第29-31页
    3.2 可行性需求分析第31-37页
        3.2.1 技术可行性第31-34页
        3.2.2 数据集第34-36页
        3.2.3 性能评测标准第36-37页
    3.3 功能需求分析第37-38页
    3.4 本章小结第38-39页
第四章 系统详细设计第39-68页
    4.1 系统概述第39-40页
    4.2 语音信号采集第40-41页
        4.2.1 语音信号获取第40页
        4.2.2 预处理第40-41页
    4.3 特征提取第41-54页
        4.3.1 底层声学特征提取第42-44页
        4.3.2 带有瓶颈层的DNN训练及特征提取第44-49页
        4.3.3 基于音素状态的特征学习第49-53页
        4.3.4 基于DBF语言识别系统第53-54页
    4.4 模型训练第54-59页
        4.4.1 GMM参数估计方法第54-56页
        4.4.2 GMM模型训练第56-59页
    4.5 模式匹配第59-66页
        4.5.1 TV模型参数估计第59-60页
        4.5.2 ivector的后验概率分布第60页
        4.5.3 GMM超矢量的后验概率分布第60-61页
        4.5.4 目标函数优化第61页
        4.5.5 基于DNN的TV建模方法第61-62页
        4.5.6 DNN后验计算下的TV建模方法第62-64页
        4.5.7 基于DBF的DNN-TV系统建模方法第64-66页
    4.6 得分判决第66-67页
    4.7 本章小结第67-68页
第五章 系统测试与分析第68-81页
    5.1 DBF特征有效性测试第68-71页
        5.1.1 DBF与传统SDC特征的性能对比第68-70页
        5.1.2 DBF和SDC在易混语言和方言中的性能对比第70-71页
    5.2 模型域测试第71-74页
        5.2.1 DBF-GMM与DNN的性能对比第72-73页
        5.2.2 基于DNN的TV系统性能对比第73-74页
    5.3 系统功能测试第74-80页
        5.3.1 本地测试第74-78页
        5.3.2 网络在线测试第78-79页
        5.3.3 测试结果分析第79-80页
    5.4 本章小结第80-81页
第六章 总结与展望第81-83页
    6.1 本文的主要贡献第81-82页
    6.2 后续的研究展望第82-83页
致谢第83-84页
参考文献第84-87页
攻硕期间取得的研究成果第87-88页

论文共88页,点击 下载论文
上一篇:超立方体中Q_n路和树的研究
下一篇:旋转自动门安全控制系统的设计与实现