首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

藏语语音深度特征提取及语音识别研究

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第11-15页
    1.1 研究背景与意义第11-12页
    1.2 藏语语音识别技术的发展现状第12-13页
    1.3 论文创新点第13页
    1.4 本文主要内容及结构第13-15页
第二章 语音识别基本原理和相关理论第15-27页
    2.1 人脑语音识别机理第15-16页
    2.2 数字语音信号预处理第16页
    2.3 数字语音信号的特征提取第16-17页
        2.3.1 时域特征第16-17页
        2.3.2 频域特征第17页
    2.4 声学模型第17-23页
        2.4.1 隐马尔科夫模型(HMM)第18-22页
        2.4.2 GMM-HMM声学模型第22-23页
    2.5 语言模型第23-24页
    2.6 藏语语音基本特点第24-27页
第三章 基于深度学习的藏语语音特征提取研究第27-37页
    3.1 深度学习的基本思想和常用方法第27-28页
        3.1.1 深度学习的基本思想第27页
        3.1.2 深度学习的常用模型第27-28页
    3.2 稀疏自动编码器模型第28-32页
        3.2.1 稀疏自动编码器原理第28-31页
        3.2.2 基于稀疏自动编码器的藏语深度特征提取模型第31-32页
    3.3 深度置信网模型第32-37页
        3.3.1 深度置信网模型原理第32-35页
        3.3.2 基于深度置信网的藏语深度特征提取模型第35-37页
第四章 基于深度特征的藏语语音识别声学模型研究第37-41页
    4.1 建模单元的选择第37-38页
    4.2 HMM模型训练第38页
        4.2.1 triphones模型训练第38页
    4.3 基于深度特征的声学建模第38-39页
    4.4 基于深度特征和人工特征相结合的声学建模第39-41页
第五章 仿真与实验第41-48页
    5.1 语音样本库的建立第41-42页
        5.1.1 语音信号预处理第41-42页
    5.2 基于MFCC特征的声学模型实验结果第42页
        5.2.1 音素、音节识别结果第42页
    5.3 基于深度特征的声学模型实验结果第42-48页
        5.3.1 基于SA的音素、音节识别结果第42-44页
            5.3.1.1 实验设置第42页
            5.3.1.2 实验结果第42-44页
        5.3.2 基于DBN的音素、音节识别结果第44-48页
            5.3.2.1 实验设置第44-45页
            5.3.2.2 实验结果第45-48页
第六章 总结与展望第48-50页
    6.1 总结第48页
    6.2 展望第48-50页
参考文献第50-52页
致谢第52-53页
攻读学位期间发表的学术论文目录第53页

论文共53页,点击 下载论文
上一篇:基于倒谱距离特征和卷积神经网络的语音情感识别研究
下一篇:带自适应均衡功能2.5Gb/s光接收机前端放大器设计