摘要 | 第1-5页 |
Abstract | 第5-10页 |
1 绪论 | 第10-18页 |
1.1 研究背景与现状 | 第10-11页 |
1.2 说话人识别的应用 | 第11页 |
1.3 说话人识别的基本原理 | 第11-16页 |
1.3.1 说话人识别的基本概念 | 第11-12页 |
1.3.2 说话人识别的分类 | 第12页 |
1.3.3 说话人识别的常用方法 | 第12-16页 |
1.4 说话人识别的难点 | 第16-17页 |
1.5 论文的结构安排 | 第17-18页 |
2 基础知识 | 第18-24页 |
2.1 语音信号的倒谱特征 | 第18-20页 |
2.2 语音信号的线性预测分析 | 第20-21页 |
2.3 独立分量分析的基本原理 | 第21-24页 |
3 说话人识别的特征提取技术 | 第24-42页 |
3.1 语音信号的预处理 | 第24页 |
3.2 线性预测倒谱系数(LPCC)特征提取 | 第24-25页 |
3.3 ACW特征提取 | 第25-27页 |
3.4 MFCC特征提取 | 第27-29页 |
3.5 基于加权 F比的MFCC特征提取 | 第29-31页 |
3.5.1 语音特征的评价 | 第29-30页 |
3.5.2 基于加权 F比的MFCC | 第30-31页 |
3.6 MFCC中加入能量信息和过渡信息 | 第31-33页 |
3.6.1 在 MFCC中加入归一化短时能量 | 第32页 |
3.6.2 语音信号过渡信息的提取 | 第32-33页 |
3.7 基于主分量分析提取特征的说话人识别 | 第33-37页 |
3.7.1 基于主分量分析的特征提取 | 第33-36页 |
3.7.2 基于主分量分析及 F比的说话人识别 | 第36-37页 |
3.8 基于独立分量分析的特征提取 | 第37-42页 |
3.8.1 独立分量分析的算法 | 第38-39页 |
3.8.2 独立特征抽取与说话人识别 | 第39-42页 |
4 基于高斯混合模型的说话人辨认 | 第42-51页 |
4.1 高斯混合模型的概念 | 第42-43页 |
4.2 EM算法 | 第43-48页 |
4.2.1 最大似然估计 | 第44-45页 |
4.2.2 EM算法原理 | 第45-46页 |
4.2.3 用 EM算法估计 GMM的参数 | 第46-48页 |
4.3 应用于说话人辨认的GMM系统 | 第48-51页 |
5 基于GMM的说话人辨认系统仿真实验及分析 | 第51-70页 |
5.1 仿真实验环境 | 第51页 |
5.1.1 硬件及软件条件 | 第51页 |
5.1.2 实验使用语音库 | 第51页 |
5.2 仿真实验及分析 | 第51-70页 |
5.2.1 系统基本识别性能研究 | 第51-54页 |
5.2.2 基于加权 F比的MFCC识别实验 | 第54-56页 |
5.2.3 基于 F比的含能量信息的MFCC识别实验 | 第56-58页 |
5.2.4 基于 F比的含过渡信息的MFCC识别实验 | 第58-62页 |
5.2.5 基于 F比的应用主分量分析提取特征的识别实验 | 第62-66页 |
5.2.6 基于 F比的应用独立分量分析提取特征的识别实验 | 第66-70页 |
结论 | 第70-71页 |
参考文献 | 第71-74页 |
攻读硕士学位期间发表学术论文情况 | 第74-75页 |
致谢 | 第75-76页 |
大连理工大学学位论文版权使用授权书 | 第76页 |