首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于听觉特征参数的说话人识别技术

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-14页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 说话人技术研究难点第12-13页
    1.4 本文的主要研究内容和文章安排第13-14页
        1.4.1 主要研究内容第13页
        1.4.2 文章安排第13-14页
第2章 说话人识别基础第14-23页
    2.1 引言第14页
    2.2 说话人识别基本原理第14-15页
        2.2.1 说话人识别系统结构第14页
        2.2.2 说话人识别分类第14-15页
    2.3 语音信号产生数学模型第15-17页
        2.3.1 激励模型第16页
        2.3.2 声道模型第16页
        2.3.3 辐射模型第16-17页
    2.4 信号预处理第17-21页
        2.4.1 预加重第17-18页
        2.4.2 加窗分帧第18-19页
        2.4.3 端点检测第19-21页
    2.5 说话人识别模型第21-22页
    2.6 本章小结第22-23页
第3章 基于高斯混合模型的说话人识别第23-35页
    3.1 引言第23页
    3.2 经典语音参数第23-27页
        3.2.1 线性预测倒谱系数第23-24页
        3.2.2 梅尔倒谱系数第24-27页
    3.3 特征参数的评价方法第27-28页
    3.4 高斯混合模型第28-32页
        3.4.1 基本原理第29-31页
        3.4.2 GMM识别算法第31-32页
    3.5 GMM说话人识别实验和分析第32-34页
        3.5.1 特征参数性能分析第32-33页
        3.5.2 高斯混合阶数分析第33-34页
    3.6 本章小结第34-35页
第4章 基于听觉特性的改进特征参数第35-48页
    4.1 引言第35页
    4.2 卷积窗第35-40页
        4.2.1 频谱泄露第35-36页
        4.2.2 窗函数的选择第36-38页
        4.2.3 汉明卷积窗定义第38-40页
    4.3 基于伽马通滤波器的听觉模型第40-45页
        4.3.1 伽马通滤波器特性第40-42页
        4.3.2 全极点伽马通滤波器的实现第42-44页
        4.3.3 改进特征参数提取第44-45页
    4.4 实验仿真和结果分析第45-47页
    4.5 本章小结第47-48页
第5章 基于小波变换的耳蜗倒谱系数第48-62页
    5.1 引言第48页
    5.2 小波变换第48-50页
        5.2.1 小波变换基本原理第48-49页
        5.2.2 小波变换与傅里叶变换的比较第49-50页
    5.3 耳蜗滤波器倒谱系数的实现第50-53页
        5.3.1 听觉变换第50-52页
        5.3.2 毛细胞窗口第52页
        5.3.3 非线性响度和DCT第52-53页
    5.4 不同频域尺度的耳蜗特征参数第53-59页
        5.4.1 耳蜗滤波器时频特性第53-55页
        5.4.2 不同频域尺度的频带划分第55-59页
    5.5 实验仿真和结果分析第59-61页
    5.6 本章小结第61-62页
第6章 总结与展望第62-64页
    6.1 工作总结第62-63页
    6.2 展望第63-64页
参考文献第64-68页
致谢第68-69页
附录A 个人简历第69-70页
附录B 攻读硕士学位期间撰写的论文第70-71页
附录C 论文中的用图第71-73页
附录D 论文中的用表第73页

论文共73页,点击 下载论文
上一篇:膜世界模型中黑洞的似正规模
下一篇:基于Kerr介质非线性的量子态的制备和分发