首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于深度学习的短语音说话人识别研究

摘要第4-6页
Abstract第6-7页
1 绪论第11-17页
    1.1 短时说话人识别概述第11-14页
        1.1.1 课题的背景和意义第11-12页
        1.1.2 说话人识别技术回顾第12-13页
        1.1.3 短时说话人识别面临的问题第13-14页
    1.2 深度学习与说话人识别第14-15页
    1.3 论文说话人识别系统评价指标第15页
    1.4 论文主要研究问题与内容第15-17页
2 说话人识别的相关技术基础第17-28页
    2.1 说话人识别基本原理第17页
    2.2 语音数据预处理第17-18页
        2.2.1 预加重第17-18页
        2.2.2 分帧加窗第18页
        2.2.3 端点检测第18页
    2.3 语音特征提取第18-21页
        2.3.1 倒谱分析与梅尔频率倒谱系数第19页
        2.3.2 梅尔频率倒谱系数第19-21页
    2.4 GMM-UBM说话人识别模型第21-27页
        2.4.1 高斯混合模型第21-23页
        2.4.2 UBM模型的EM算法第23-25页
        2.4.3 目标说话人模型的MAP自适应第25-26页
        2.4.4 GMM-UBM说话人识别系统第26-27页
    2.5 本章小结第27-28页
3 深度学习基础理论第28-37页
    3.1 深度学习概述第28-29页
    3.2 基于能量的模型第29-30页
    3.3 受限玻尔兹曼机第30-33页
        3.3.1 受限玻尔兹曼机基本模型第30-32页
        3.3.2 对比散度算法第32-33页
    3.4 深度神经网络关键技术第33-36页
        3.4.1 无监督的逐层贪婪预训练第34页
        3.4.2 有监督的参数优化第34-36页
    3.5 本章小结第36-37页
4 基于深度学习的语音特征提取第37-46页
    4.1 引言第37页
    4.2 卷积深度信念网络第37-39页
        4.2.1 概率最大池化-卷积受限玻尔兹曼机第37-39页
        4.2.2 稀疏正则化第39页
    4.3 基于CDBN的语音特征提取实验第39-43页
        4.3.1 实验环境第39-40页
        4.3.2 实验语音数据第40页
        4.3.3 提取语音频谱特征第40-41页
        4.3.4 语音频谱特征预处理第41-42页
            4.3.4.1 数据归一化处理第41页
            4.3.4.2 主成分分析白化第41页
            4.3.4.3 数据可视化第41-42页
        4.3.5 提取CDBN特征第42-43页
        4.3.6 语音特征可视化第43页
    4.4 说话人识别实验及分析第43-44页
    4.5 本章小结第44-46页
5 基于深层神经网络的说话人识别系统第46-54页
    5.1 引言第46页
    5.2 基于深层神经网络的说话人识别后端分类第46-51页
        5.2.1 深层神经网络模型结构第46-48页
        5.2.2 模型参数训练过程第48-49页
        5.2.3 Dropout策略第49-51页
    5.3 系统的实现第51页
        5.3.1 实验数据选择第51页
        5.3.2 DNN模型训练第51页
    5.4 说话人实验及分析第51-52页
    5.5 本章小结第52-54页
6 结论和展望第54-56页
    6.1 结论第54页
    6.2 展望第54-56页
参考文献第56-60页
个人简历、在校期间发表的学术论文及研究成果第60-61页
致谢第61-63页
附录A第63-64页

论文共64页,点击 下载论文
上一篇:基于WLAN的室内定位技术研究与实现
下一篇:基于iBeacon技术的室内定位系统的研究和实现