首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的藏语非特定人连续语音识别研究

摘要第3-5页
ABSTRACT第5-7页
第一章 绪论第15-23页
    1.1 研究背景与意义第15-16页
    1.2 藏语语音识别研究发展趋势第16-18页
    1.3 语音识别系统的构成第18-21页
        1.3.1 声学特征第18-19页
        1.3.2 声学模型第19-20页
        1.3.3 语言模型第20-21页
        1.3.4 解码器第21页
    1.4 论文创新点第21-22页
    1.5 论文主要内容及结构第22-23页
第二章 藏语拉萨话语音基本知识和识别基元第23-29页
    2.1 藏语语音基本知识第23-25页
        2.1.1 藏语方言第24页
        2.1.2 藏语音节结构第24-25页
    2.2 藏语语音识别基元选取第25-27页
    2.3 藏语音素发音特征第27-28页
    2.4 本章小结第28-29页
第三章 基于GMM-HMM的藏语拉萨话连续语音识别研究第29-46页
    3.1 高斯混合-隐马尔科夫模型第29-32页
        3.1.1 HMM基本概念第29-31页
        3.1.2 HMM的三个基本问题第31页
        3.1.3 高斯混合模型第31-32页
    3.2 决策树第32-34页
    3.3 统计语言模型第34-35页
    3.4 解码第35-37页
    3.5 基于HTK的藏语连续语音识别系统研究第37-44页
        3.5.1 HTK工具箱简介第37页
        3.5.2 语音库建立第37页
        3.5.3 数据处理第37-39页
        3.5.4 单音素模型训练第39-41页
        3.5.5 三音素模型训练第41-42页
        3.5.6 语言模型训练第42-43页
        3.5.7 测试识别第43-44页
    3.6 识别结果及分析第44页
    3.7 高斯混合度对实验结果影响第44-45页
    3.8 本章小结第45-46页
第四章 基于深度神经网络的藏语拉萨话连续语音识别研究第46-55页
    4.1 深度学习模型第46-51页
        4.1.1 深度学习的背景第46-47页
        4.1.2 深度学习与浅层学习第47-48页
        4.1.3 深度学习的结构第48-49页
        4.1.4 RBM实现深度学习第49-51页
    4.2 基于DNN-HMM声学建模第51-52页
    4.3 基于BN-GMM-HMM声学建模第52-54页
    4.4 基于BN+MFCC-GMM-HMM声学建模第54页
    4.5 本章小结第54-55页
第五章 基于kaldi平台的语音识别实验与系统实现第55-66页
    5.1 Kaldi语音识别系统开发平台第55-56页
    5.2 数据准备第56-60页
        5.2.1 语料库与评价指标第56页
        5.2.2 语音数据第56-59页
        5.2.3 语言数据第59-60页
    5.3 声学模型训练实验第60-62页
        5.3.1 基于GMM-HMM声学模型第60-61页
        5.3.2 基于DNN-HMM声学模型第61-62页
        5.3.3 基于深度瓶颈特征声学模型第62页
    5.4 实验结果分析第62-64页
    5.5 kaldi平台上藏语在线语音识别系统第64-65页
    5.6 本章小结第65-66页
第六章 总结与展望第66-68页
    6.1 总结第66-67页
    6.2 展望第67-68页
参考文献第68-72页
致谢第72-73页
攻读学位期间发表的学术论文目录第73页

论文共73页,点击 下载论文
上一篇:可抗复制的无线数字身份认证协议研究与系统实现
下一篇:北斗三频精密单点定位相关技术研究