基于VQ与HMM的说话人识别系统的研究
第1章 绪论 | 第1-19页 |
1.1 研究背景及意义 | 第8-9页 |
1.2 说话人识别的国内外研究现状 | 第9-11页 |
1.2.1 国内外水平 | 第9页 |
1.2.2 主要应用领域 | 第9-10页 |
1.2.3 技术的难点 | 第10-11页 |
1.3 说话人识别基本介绍 | 第11-17页 |
1.3.1 说话人识别的基本原理 | 第11-12页 |
1.3.2 说话人识别常用的特征 | 第12-13页 |
1.3.3 说话人识别的分类 | 第13-14页 |
1.3.4 说话人识别的主要方法 | 第14-16页 |
1.3.5 说话人识别系统的性能评价 | 第16-17页 |
1.4 本文的研究内容 | 第17-18页 |
1.5 本章小结 | 第18-19页 |
第2章 语音信号分析与预处理 | 第19-35页 |
2.1 语音产生的机理 | 第19-20页 |
2.2 语音信号的数字化和采集 | 第20-21页 |
2.3 语音信号的数字模型 | 第21-23页 |
2.3.1 激励模型 | 第21页 |
2.3.2 声道模型 | 第21-23页 |
2.3.3 辐射模型 | 第23页 |
2.4 语音信号的预加重处理 | 第23-24页 |
2.5 语音信号的短时参数特征 | 第24-30页 |
2.5.1 短时频谱 | 第25页 |
2.5.2 短时自相关函数 | 第25-26页 |
2.5.3 短时能量和短时平均幅度 | 第26页 |
2.5.4 短时过零分析 | 第26-27页 |
2.5.5 倒谱 | 第27页 |
2.5.6 线性预测编码(LPC)参数 | 第27-28页 |
2.5.7 短时基音周期估计 | 第28-30页 |
2.6 语音信号端点检测 | 第30-34页 |
2.6.1 双门限端点检测算法 | 第30-31页 |
2.6.2 LPC美尔倒谱特征端点检测方法 | 第31-34页 |
2.7 本章小结 | 第34-35页 |
第3章 特征提取 | 第35-50页 |
3.1 线性预测系数LPC | 第36-42页 |
3.1.1 线性预测基本原理 | 第37-40页 |
3.1.2 线性预测方程组的求解方法 | 第40-42页 |
3.2 线性预测倒谱系数LPCC | 第42-46页 |
3.2.1 同态信号处理的基本原理 | 第43-44页 |
3.2.2 线性预测倒谱及差分谱 | 第44-46页 |
3.3 美尔倒谱系数MFCC | 第46-49页 |
3.4 本章小结 | 第49-50页 |
第4章 矢量量化与隐马尔可夫模型 | 第50-64页 |
4.1 矢量量化 | 第50-56页 |
4.1.1 矢量量化的基本概念 | 第50-51页 |
4.1.2 LBG算法 | 第51-53页 |
4.1.3 初始码书的设置方法 | 第53-54页 |
4.1.4 基于矢量量化的说话人识别 | 第54-56页 |
4.2 隐马尔可夫模型HMM | 第56-63页 |
4.2.1 隐马尔可夫链 | 第56-57页 |
4.2.2 隐马尔可夫模型的基本概念 | 第57-59页 |
4.2.3 隐马尔可夫模型的三个基本问题 | 第59-62页 |
4.2.4 基于隐马尔可夫模型的说话人识别 | 第62-63页 |
4.3 本章小结 | 第63-64页 |
第5章 说话人识别系统 | 第64-73页 |
5.1 说话人识别系统结构的设计 | 第64-65页 |
5.2 说话人识别系统实现 | 第65-72页 |
5.2.1 线性预测倒谱参数的提取实现 | 第65-67页 |
5.2.2 美尔倒谱系数及其差分的提取实现 | 第67-69页 |
5.2.3 说话识别系统的实现 | 第69-72页 |
5.3 本章小结 | 第72-73页 |
第6章 总结与展望 | 第73-76页 |
参考文献 | 第76-78页 |
致谢 | 第78-79页 |
攻读学位期间发表的学术论文 | 第79页 |