首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

变音环境下鲁棒性说话人辨认关键技术研究

摘要第4-6页
Abstract第6-7页
专用术语注释表第10-11页
第一章 绪论第11-17页
    1.1 引言第11-12页
    1.2 说话人识别技术第12-14页
    1.3 说话人识别中的问题第14-15页
    1.4 感冒语音对说话人识别的影响第15页
    1.5 论文内容和结构安排第15-17页
第二章 说话人识别系统第17-29页
    2.1 说话人识别系统框架第17-18页
    2.2 预处理第18-22页
        2.2.1 语音信号的产生第18-20页
        2.2.2 端点检测第20-21页
        2.2.3 预加重第21-22页
        2.2.4 分帧和加窗第22页
    2.3 特征提取第22-24页
    2.4 说话人模型第24-27页
        2.4.1 基于模板的模型第24-25页
        2.4.2 基于人工神经网络的模型第25-26页
        2.4.3 随机概率模型第26-27页
    2.5 说话人识别性能评价第27-28页
    2.6 本章小结第28-29页
第三章 基于不同预加重滤波器的GMM模型说话人辨认第29-46页
    3.1 语音数据库第29-34页
        3.1.1 鼻音的产生及其特点第29-31页
        3.1.2 感冒语音频谱特征第31-34页
    3.2 预加重第34-37页
        3.2.1 经典预加重滤波器第34-35页
        3.2.2 特殊预加重滤波器第35-37页
    3.3 基于GMM的说话人辨认系统第37-41页
        3.3.1 预加重滤波器参数第38页
        3.3.2 MFCC特征提取第38-40页
        3.3.3 GMM模型第40-41页
    3.4 实验仿真与结果分析第41-45页
        3.4.1 实验一:语音信号预加重处理与否对系统性能的影响第41-43页
        3.4.2 实验二:特殊预加重滤波器参数选择第43-44页
        3.4.3 实验三:不同预加重滤波器对系统性能的影响第44-45页
    3.5 本章小结第45-46页
第四章 基于不同特征得分融合的说话人辨认第46-65页
    4.1 信息融合方法的介绍第46-53页
        4.1.1 特征级融合第47-48页
        4.1.2 匹配分数级融合第48-50页
        4.1.3 决策级融合第50-53页
    4.2 基于匹配分数级融合的GMM说话人辨认系统第53-59页
        4.2.1 Spearman相关系数第54-55页
        4.2.2 特征提取第55-58页
        4.2.3 得分归一化第58-59页
        4.2.4 得分融合第59页
    4.3 实验结果及分析第59-64页
        4.3.1 实验一:单一特征系统性能分析第59-61页
        4.3.2 实验二:得分融合系统性能分析第61-64页
    4.4 本章小结第64-65页
第五章 基于压缩感知的感冒语音说话人辨认系统第65-74页
    5.1 压缩感知简介第65页
    5.2 语音检测第65-67页
    5.3 基于压缩感知的特征参数CS-MFCC第67-71页
        5.3.1 行阶梯矩阵第67-69页
        5.3.2 CS-MFCC特征提取第69-71页
    5.4 基于压缩感知的感冒语音说话人辨认研究第71-73页
        5.4.1 系统框图第71页
        5.4.2 实验仿真与结果分析第71-73页
    5.5 本章小结第73-74页
第六章 总结与展望第74-77页
    6.1 工作总结第74-75页
    6.2 未来展望第75-77页
参考文献第77-82页
附录1攻读硕士学位期间撰写的论文第82-83页
附录2攻读硕士学位期间参加的科研项目第83-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:TD-LTE三频段微带天线的设计与研究
下一篇:基于自由概率理论的频谱感知技术研究