基于VQ和GMM的与文本无关的说话人识别研究
摘要 | 第1-4页 |
ABSTRACT | 第4-9页 |
1 绪论 | 第9-12页 |
·研究背景和意义 | 第9页 |
·说话人识别的发展及现状 | 第9-11页 |
·本文主要研究内容 | 第11-12页 |
2 说话人识别系统概述 | 第12-21页 |
·说话人识别的基本原理 | 第12-13页 |
·说话人识别系统的典型结构 | 第12页 |
·技术原理 | 第12-13页 |
·说话人识别的特征选择 | 第13-16页 |
·说话人识别系统中常用的特征 | 第13-15页 |
·语音特征参数的统计评价 | 第15-16页 |
·说话人识别的主要方法 | 第16-19页 |
·模板匹配法 | 第16-17页 |
·概率统计方法 | 第17-18页 |
·辨别分类器法 | 第18页 |
·混合方法 | 第18-19页 |
·判决规则与性能评价标准 | 第19-20页 |
·说话人辨认系统的评价 | 第19页 |
·说话人确认系统的评价 | 第19-20页 |
·本章小结 | 第20-21页 |
3 语音特征参数的提取 | 第21-35页 |
·语音信号的预处理 | 第21-23页 |
·预加重 | 第21页 |
·端点检测 | 第21-22页 |
·分帧 | 第22页 |
·加窗 | 第22-23页 |
·基音周期 | 第23页 |
·线性预测参数的提取 | 第23-29页 |
·基本理论 | 第24-25页 |
·线性预测系数的求取 | 第25-26页 |
·语音信号的同态处理 | 第26-27页 |
·线性预测倒谱系数 LPCC | 第27-29页 |
·MFCC 参数的提取 | 第29-34页 |
·听觉系统的生理机制 | 第29-30页 |
·Mel 频率简介 | 第30-31页 |
·美尔倒谱系数MFCC 及其提取算法 | 第31-33页 |
·求取MFCC 系数的具体算法和步骤 | 第33-34页 |
·本章小结 | 第34-35页 |
4 说话人识别的模型 | 第35-43页 |
·矢量量化(VQ) | 第35-36页 |
·隐马尔可夫模型(HMM) | 第36-39页 |
·隐马尔可夫链 | 第36-37页 |
·隐马尔可夫模型的基本概念 | 第37-38页 |
·隐马尔可夫模型用于说话人识别 | 第38-39页 |
·高斯混合模型(GMM) | 第39-40页 |
·人工神经网络模型(ANN) | 第40-42页 |
·神经网络的结构 | 第40-41页 |
·神经网络的学习方式 | 第41页 |
·神经网络的学习规则 | 第41-42页 |
·神经网络用于说话人识别 | 第42页 |
·本章小结 | 第42-43页 |
5 基于VQ 和GMM 的文本无关的说话人识别 | 第43-53页 |
·基于VQ 的文本无关的说话人识别 | 第43-48页 |
·矢量量化(VQ)的原理 | 第43-44页 |
·矢量量化的过程及主要问题 | 第44-45页 |
·LBG 算法 | 第45-47页 |
·初始码本的选定 | 第47-48页 |
·基于GMM 的文本无关的说话人识别 | 第48-52页 |
·高斯混合模型概述及算法原理 | 第48-49页 |
·GMM 的参数估计方法 | 第49-52页 |
·本章小结 | 第52-53页 |
6 系统实现及实验结果 | 第53-62页 |
·语音数据库 | 第53页 |
·实验软硬件平台 | 第53-55页 |
·主要软件模块流程图 | 第55-59页 |
·实验及结果分析 | 第59-61页 |
·用VQ 的文本无关的说话人确认实验 | 第59-60页 |
·用GMM 的文本无关的说话人确认实验 | 第60-61页 |
·FA 和FR 分析 | 第61页 |
·本章小结 | 第61-62页 |
7 总结和展望 | 第62-64页 |
·完成的工作 | 第62页 |
·进一步的工作与展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-68页 |
附录 | 第68页 |