基于VQ和GMM的与文本无关的说话人识别研究
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-9页 |
| 1 绪论 | 第9-12页 |
| ·研究背景和意义 | 第9页 |
| ·说话人识别的发展及现状 | 第9-11页 |
| ·本文主要研究内容 | 第11-12页 |
| 2 说话人识别系统概述 | 第12-21页 |
| ·说话人识别的基本原理 | 第12-13页 |
| ·说话人识别系统的典型结构 | 第12页 |
| ·技术原理 | 第12-13页 |
| ·说话人识别的特征选择 | 第13-16页 |
| ·说话人识别系统中常用的特征 | 第13-15页 |
| ·语音特征参数的统计评价 | 第15-16页 |
| ·说话人识别的主要方法 | 第16-19页 |
| ·模板匹配法 | 第16-17页 |
| ·概率统计方法 | 第17-18页 |
| ·辨别分类器法 | 第18页 |
| ·混合方法 | 第18-19页 |
| ·判决规则与性能评价标准 | 第19-20页 |
| ·说话人辨认系统的评价 | 第19页 |
| ·说话人确认系统的评价 | 第19-20页 |
| ·本章小结 | 第20-21页 |
| 3 语音特征参数的提取 | 第21-35页 |
| ·语音信号的预处理 | 第21-23页 |
| ·预加重 | 第21页 |
| ·端点检测 | 第21-22页 |
| ·分帧 | 第22页 |
| ·加窗 | 第22-23页 |
| ·基音周期 | 第23页 |
| ·线性预测参数的提取 | 第23-29页 |
| ·基本理论 | 第24-25页 |
| ·线性预测系数的求取 | 第25-26页 |
| ·语音信号的同态处理 | 第26-27页 |
| ·线性预测倒谱系数 LPCC | 第27-29页 |
| ·MFCC 参数的提取 | 第29-34页 |
| ·听觉系统的生理机制 | 第29-30页 |
| ·Mel 频率简介 | 第30-31页 |
| ·美尔倒谱系数MFCC 及其提取算法 | 第31-33页 |
| ·求取MFCC 系数的具体算法和步骤 | 第33-34页 |
| ·本章小结 | 第34-35页 |
| 4 说话人识别的模型 | 第35-43页 |
| ·矢量量化(VQ) | 第35-36页 |
| ·隐马尔可夫模型(HMM) | 第36-39页 |
| ·隐马尔可夫链 | 第36-37页 |
| ·隐马尔可夫模型的基本概念 | 第37-38页 |
| ·隐马尔可夫模型用于说话人识别 | 第38-39页 |
| ·高斯混合模型(GMM) | 第39-40页 |
| ·人工神经网络模型(ANN) | 第40-42页 |
| ·神经网络的结构 | 第40-41页 |
| ·神经网络的学习方式 | 第41页 |
| ·神经网络的学习规则 | 第41-42页 |
| ·神经网络用于说话人识别 | 第42页 |
| ·本章小结 | 第42-43页 |
| 5 基于VQ 和GMM 的文本无关的说话人识别 | 第43-53页 |
| ·基于VQ 的文本无关的说话人识别 | 第43-48页 |
| ·矢量量化(VQ)的原理 | 第43-44页 |
| ·矢量量化的过程及主要问题 | 第44-45页 |
| ·LBG 算法 | 第45-47页 |
| ·初始码本的选定 | 第47-48页 |
| ·基于GMM 的文本无关的说话人识别 | 第48-52页 |
| ·高斯混合模型概述及算法原理 | 第48-49页 |
| ·GMM 的参数估计方法 | 第49-52页 |
| ·本章小结 | 第52-53页 |
| 6 系统实现及实验结果 | 第53-62页 |
| ·语音数据库 | 第53页 |
| ·实验软硬件平台 | 第53-55页 |
| ·主要软件模块流程图 | 第55-59页 |
| ·实验及结果分析 | 第59-61页 |
| ·用VQ 的文本无关的说话人确认实验 | 第59-60页 |
| ·用GMM 的文本无关的说话人确认实验 | 第60-61页 |
| ·FA 和FR 分析 | 第61页 |
| ·本章小结 | 第61-62页 |
| 7 总结和展望 | 第62-64页 |
| ·完成的工作 | 第62页 |
| ·进一步的工作与展望 | 第62-64页 |
| 致谢 | 第64-65页 |
| 参考文献 | 第65-68页 |
| 附录 | 第68页 |