首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于矢量量化(VQ)的说话人识别的研究

摘要第3-4页
Abstract第4页
1 绪论第9-15页
    1.1 说话人识别的研究背景与意义第9-10页
    1.2 说话人识别的国内外研究现状第10-11页
    1.3 说话人识别的研究难点及热点第11-12页
    1.4 本文的主要工作第12-13页
    1.5 本文的组织结构第13-15页
2 说话人识别概述第15-23页
    2.1 语音的发声机理及产生模型第15-17页
        2.1.1 激励模型第15-16页
        2.1.2 声道模型第16-17页
        2.1.3 辐射模型第17页
    2.2 说话人识别的概念与分类第17-18页
    2.3 说话人识别基本原理及其系统结构第18-19页
    2.4 说话人识别模型第19-20页
    2.5 说话人识别系统性能的评价指标第20-21页
    2.6 语音文件格式第21-22页
    2.7 本章总结第22-23页
3 语音信号的预处理第23-42页
    3.1 预加重第23页
    3.2 语音信号的分帧及加窗第23-25页
    3.3 语音信号的去噪第25-31页
        3.3.1 噪声的来源及分类第25-26页
        3.3.2 传统语音增强算法第26-31页
    3.4 本文去噪方法第31-35页
        3.4.1 ICA基本原理第31-32页
        3.4.2 基于负熵的FastICA第32-33页
        3.4.3 本文去噪方法及实验第33-35页
    3.5 端点检测第35-41页
        3.5.1 传统的双门限端点检测第35-36页
        3.5.2 基于倒谱距离的端点检测第36-37页
        3.5.3 本文的端点检测方法第37-40页
        3.5.4 改进的倒谱距离端点检测方法与传统端点检测算法效果对比第40-41页
    3.6 本章小结第41-42页
4 语音信号的特征分析第42-58页
    4.1 语音信号的时域分析第42-46页
        4.1.1 短时能量分析第42-43页
        4.1.2 短时平均过零率分析第43-44页
        4.1.3 短时自相关函数分析第44-46页
    4.2 语音信号的倒谱与复倒谱分析第46-55页
        4.2.1 线性预测参数第46-51页
        4.2.2 MEL倒谱系数(MFCC)第51-53页
        4.2.3 差分特征参数第53-54页
        4.2.4 声门信息融合第54-55页
    4.3 基于FISHER准则的特征选择第55-57页
        4.3.1 基于Fisher准则的混合特征参数的提取第56-57页
    4.4 本章小结第57-58页
5 矢量量化(VQ)模型第58-64页
    5.1 矢量量化(VQ)概述第58-59页
    5.2 矢量量化的定义第59-60页
    5.3 矢量量化的失真测度第60页
    5.4 最佳矢量量化器的设计第60-63页
        5.4.1 LBG算法第61-62页
        5.4.2 改进LBG算法第62页
        5.4.3 初始码本生成第62-63页
    5.5 本章小结第63-64页
6 系统实现及实验结果第64-74页
    6.1 系统框架及实现平台第64-66页
    6.2 语音库介绍第66页
    6.3 基于VQ的说话人识别实验结果第66-73页
        6.3.1 特征矢量维数对识别结果的影响第66-67页
        6.3.2 码本尺寸对识别结果的影响第67-68页
        6.3.3 测试语音长度对识别结果的影响第68页
        6.3.4 端点检测对识别结果的影响第68-69页
        6.3.5 特征参数类型对识别结果的影响第69-71页
        6.3.6 语音增强对识别结果的影响第71-72页
        6.3.7 改进LBG算法对识别结果的影响第72-73页
    6.4 本章小结第73-74页
7 总结及展望第74-75页
致谢第75-76页
参考文献第76-80页
附录第80页

论文共80页,点击 下载论文
上一篇:利益相关者视角下中外合作大学治理研究--以宁波诺丁汉大学为例
下一篇:不同手术方式对剖宫产术后子宫瘢痕憩室治疗效果分析