首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

面向藏语拉萨话语音识别的语音增强方法研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-14页
    1.1 引言第10页
    1.2 研究目的和意义第10-11页
        1.2.1 研究目的第10页
        1.2.2 研究意义第10-11页
    1.3 国内外研究现状第11-12页
    1.4 论文章节概要第12-14页
第2章 语音增强方法基础理论与知识第14-19页
    2.1 基础理论分析第14页
    2.2 语音增强分类第14-18页
        2.2.1 多通道语音增强方法第14-15页
        2.2.2 自适应滤波语音增强方法第15-16页
        2.2.3 谱减语音增强方法第16页
        2.2.4 维纳滤波的语音增强方法第16页
        2.2.5 基于最小均误差的方幅度谱和对数谱估计第16-17页
        2.2.6 基于深度神经网络的方法第17-18页
    2.3 本章小结第18-19页
第3章 藏语拉萨话基础及实验数据准备第19-22页
    3.1 藏语语音增强和相关知识探讨第19页
    3.2 藏语拉萨话语音基本特征第19-20页
        3.2.1 藏语的演变第19页
        3.2.2 藏语发音第19-20页
        3.2.3 藏语拉萨话分类和选取第20页
    3.3 藏语语料库和噪音库的准备第20-21页
    3.4 本章小结第21-22页
第4章 经典单通道语音增强第22-35页
    4.1 语音信号预处理概要第22-25页
        4.1.1 预滤波、预加重、采样第22页
        4.1.2 语音信号的分帧加窗第22-23页
        4.1.3 语音信号特征提取第23页
        4.1.4 语音端点检测(VoiceActivityDetection,VAD)第23-25页
    4.2 自适应滤波器语音增强第25-27页
        4.2.1 自适应滤波LMS算法原理第25-26页
        4.2.2 LMS语音增强系统运行原理第26-27页
    4.3 谱减法语音增强第27-29页
        4.3.1 谱减法基本原理第27-28页
        4.3.2 谱减法语音增强系统第28-29页
    4.4 维纳滤波语音增强第29-32页
        4.4.1 维纳滤波原理第29-31页
        4.4.2 维纳滤波系统第31-32页
    4.5 最小均方误差幅度域和对数域语音增强第32-33页
    4.6 本章小结第33-35页
第5章 基于深度神经网络的语音增强方法第35-46页
    5.1 深度神经网络语音增强探讨和分析第35页
    5.2 深度神经网络的发展第35页
    5.3 深度神经网络基本原理第35-37页
    5.4 受限制玻尔兹曼机以及受限制玻尔兹曼机的初始化第37-40页
        5.4.1 受限制玻尔兹曼机第37-39页
        5.4.2 玻尔兹曼机初始化第39-40页
    5.5 深度神经网络训练第40-43页
        5.5.1 无监督DBN的训练第40-42页
        5.5.2 深度神经网络通过误差反向传播调优第42-43页
    5.6 深度神经网络的语音增强系统第43-44页
    5.7 本章小结第44-46页
第6章 实验分析及结果第46-55页
    6.1 实验过程第46-50页
        6.1.1 语音检测指标第46-48页
        6.1.2 实验内容第48-50页
    6.2 实验结果比较与分析第50-53页
        6.2.1 SSNR的结果的比较分析第50页
        6.2.2 LPD和PESQ结果的比较分析第50-52页
        6.2.3 增强后的语音识别系统率的比较分析第52-53页
        6.2.4 MOS平均主观判断得分比较第53页
    6.3 实验结论第53-54页
    6.4 本章小结第54-55页
第7章 总结和展望第55-57页
    7.1 全文总结第55-56页
    7.2 未来研究展望第56-57页
参考文献第57-61页
附录第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:TiN纳米电容器的构建及性能研究
下一篇:纳米复合纤维柔性膜状电极及其固态超级电容器性能研究