第一章 绪论 | 第1-12页 |
§1-1 语音信号数字处理概述 | 第8页 |
§1-2 说话人识别技术 | 第8-11页 |
1-2-1 说话人识别研究背景及应用领域 | 第9-10页 |
1-2-2 说话人识别的特征参数 | 第10页 |
1-2-3 说话人识别的方法 | 第10-11页 |
§1-3 本论文主要研究内容 | 第11-12页 |
第二章 语音信号的预处理 | 第12-18页 |
§2-1 语音信号的获取 | 第12页 |
2-1-1 语音的产生 | 第12页 |
2-1-2 语音信号的数字化和采集 | 第12页 |
§2-2 语音信号的产生模型 | 第12-14页 |
2-2-1 激励模型 | 第13页 |
2-2-2 声道模型 | 第13-14页 |
2-2-3 辐射模型 | 第14页 |
§2-3 语音信号预加重 | 第14页 |
§2-4 语音信号的时域分析 | 第14-17页 |
2-4-1 短时能量和短时平均幅度 | 第14-16页 |
2-4-2 短时平均过零率 | 第16页 |
2-4-3 基音 | 第16-17页 |
§2-5 小结 | 第17-18页 |
第三章 基于LPCC和MFCC的语音信号特征提取 | 第18-30页 |
§3-1 说话人识别常用特征参数 | 第18页 |
§3-2 线性预测系数LPC | 第18-21页 |
3-2-1 线性预测的基本原理 | 第18-20页 |
3-2-2 用DURBIN算法求取线性预测系数 | 第20-21页 |
3-2-3 LPC模型阶数的确定 | 第21页 |
§3-3 线性预测倒谱系数LPCC | 第21-25页 |
3-3-1 同态处理基本原理 | 第21-22页 |
3-3-2 复倒谱和倒谱 | 第22页 |
3-3-3 线性预测倒谱 | 第22-24页 |
3-3-4 线性预测差分倒谱 | 第24页 |
3-3-5 线性预测倒谱失真测度 | 第24-25页 |
§3-4 美尔倒谱系数MFCC | 第25-29页 |
3-4-1 临界带宽 | 第25-26页 |
3-4-2 Mel频率 | 第26页 |
3-4-3 符合临界频带特性的滤波器组的设计及MFCC系数提取 | 第26-28页 |
3-4-4 美尔差分倒谱参数 | 第28页 |
3-4-5 MFCC分量的选择 | 第28-29页 |
3-4-6 MFCC的优点 | 第29页 |
§3-5 小结 | 第29-30页 |
第四章 基于矢量量化的说话人识别方法 | 第30-41页 |
§4-1 说话人识别的基本方法 | 第30页 |
§4-2 矢量量化在说话人识别中的应用 | 第30-37页 |
4-2-1 矢量量化概述 | 第30-32页 |
4-2-2 矢量量化码本的生成 | 第32-35页 |
4-2-3 基于矢量量化的说话人识别 | 第35-36页 |
4-2-4 改进的连续分布矢量量化码本CVQ | 第36-37页 |
§4-3 动态时间规整算法在说话人识别中的应用 | 第37-39页 |
4-3-1 动态时间规整 | 第37-38页 |
4-3-2 动态时间规整算法的局限性 | 第38-39页 |
§4-4 隐马尔可夫模型在说话人识别中的应用 | 第39页 |
§4-5 小结 | 第39-41页 |
第五章 实验过程与结果分析 | 第41-47页 |
§5-1 实验前的准备工作 | 第41-43页 |
5-1-1 语音数据库 | 第41页 |
5-1-2 语音信号的采集 | 第41-43页 |
5-1-3 实验中需要注意的问题 | 第43页 |
§5-2 基于矢量量化的文本相关说话人识别过程与结果分析 | 第43-46页 |
5-2-1 识别算法流程 | 第43-45页 |
5-2-2 识别结果分析 | 第45-46页 |
§5-3 小结 | 第46-47页 |
第六章 结论 | 第47-48页 |
参考文献 | 第48-50页 |
致谢 | 第50-51页 |
攻读学位期间所取得的相关科研成果 | 第51页 |