| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 图表目录 | 第9-10页 |
| 第1章 绪论 | 第10-18页 |
| ·研究意义 | 第10-11页 |
| ·基本概念 | 第11-12页 |
| ·研究进展与趋势 | 第12-14页 |
| ·存在的问题 | 第14-15页 |
| ·应用前景 | 第15-16页 |
| ·本文的研究工作 | 第16-18页 |
| 第2章 说话人识别技术基础与理论 | 第18-29页 |
| ·系统结构 | 第18-19页 |
| ·特征提取 | 第19-23页 |
| ·预处理 | 第20-22页 |
| ·美尔倒谱系数 | 第22-23页 |
| ·说话人识别模型 | 第23-28页 |
| ·模板匹配法 | 第23-25页 |
| ·概率模型法 | 第25-27页 |
| ·支持向量机 | 第27页 |
| ·人工神经网络 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第3章 说话人识别端点检测及其改进 | 第29-43页 |
| ·语音端点检测的意义 | 第29-30页 |
| ·端点检测的基本原理 | 第30-31页 |
| ·语音信号的时域分析 | 第31-36页 |
| ·短时能量和短时平均幅度分析 | 第31-33页 |
| ·短时过零率分析 | 第33-36页 |
| ·传统双门限端点检测算法 | 第36页 |
| ·基于短时能零差分法的端点检测算法 | 第36-40页 |
| ·短时能零差分法的原理依据 | 第36-37页 |
| ·短时能零差分法的实现步骤 | 第37-39页 |
| ·对短时能零差分法的分析 | 第39-40页 |
| ·实验结论 | 第40-42页 |
| ·本章小结 | 第42-43页 |
| 第4章 说话人识别特征提取算法的改进 | 第43-51页 |
| ·常用特征参数 | 第43-46页 |
| ·线性预测倒谱系数 | 第43-44页 |
| ·Mel 频率倒谱系数(MFCC) | 第44-45页 |
| ·其他特征参数 | 第45-46页 |
| ·传统MFCC 特征提取算法 | 第46-47页 |
| ·Mel 频率 | 第46-47页 |
| ·Mel 频率倒谱系数的求取 | 第47页 |
| ·传统MFCC 和主分量分析 (PCA) 法相结合的特征提取算法 | 第47-49页 |
| ·实验及结论 | 第49-50页 |
| ·本章小结 | 第50-51页 |
| 第5章 说话人识别系统的建立 | 第51-57页 |
| ·高斯混合模型 (GMM) 的建立 | 第51-54页 |
| ·GMM 模型定义 | 第51-52页 |
| ·GMM 模型的初始化 | 第52-53页 |
| ·得分识别模型 | 第53页 |
| ·GMM 的识别算法 | 第53-54页 |
| ·系统介绍 | 第54-56页 |
| ·系统结构介绍 | 第54页 |
| ·系统界面介绍 | 第54-56页 |
| ·本章小结 | 第56-57页 |
| 第6章 结论 | 第57-58页 |
| 参考文献 | 第58-62页 |
| 致谢 | 第62-63页 |
| 攻读学位期间发表的学术论文及参加科研情况 | 第63-64页 |