摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
图表目录 | 第9-10页 |
第1章 绪论 | 第10-18页 |
·研究意义 | 第10-11页 |
·基本概念 | 第11-12页 |
·研究进展与趋势 | 第12-14页 |
·存在的问题 | 第14-15页 |
·应用前景 | 第15-16页 |
·本文的研究工作 | 第16-18页 |
第2章 说话人识别技术基础与理论 | 第18-29页 |
·系统结构 | 第18-19页 |
·特征提取 | 第19-23页 |
·预处理 | 第20-22页 |
·美尔倒谱系数 | 第22-23页 |
·说话人识别模型 | 第23-28页 |
·模板匹配法 | 第23-25页 |
·概率模型法 | 第25-27页 |
·支持向量机 | 第27页 |
·人工神经网络 | 第27-28页 |
·本章小结 | 第28-29页 |
第3章 说话人识别端点检测及其改进 | 第29-43页 |
·语音端点检测的意义 | 第29-30页 |
·端点检测的基本原理 | 第30-31页 |
·语音信号的时域分析 | 第31-36页 |
·短时能量和短时平均幅度分析 | 第31-33页 |
·短时过零率分析 | 第33-36页 |
·传统双门限端点检测算法 | 第36页 |
·基于短时能零差分法的端点检测算法 | 第36-40页 |
·短时能零差分法的原理依据 | 第36-37页 |
·短时能零差分法的实现步骤 | 第37-39页 |
·对短时能零差分法的分析 | 第39-40页 |
·实验结论 | 第40-42页 |
·本章小结 | 第42-43页 |
第4章 说话人识别特征提取算法的改进 | 第43-51页 |
·常用特征参数 | 第43-46页 |
·线性预测倒谱系数 | 第43-44页 |
·Mel 频率倒谱系数(MFCC) | 第44-45页 |
·其他特征参数 | 第45-46页 |
·传统MFCC 特征提取算法 | 第46-47页 |
·Mel 频率 | 第46-47页 |
·Mel 频率倒谱系数的求取 | 第47页 |
·传统MFCC 和主分量分析 (PCA) 法相结合的特征提取算法 | 第47-49页 |
·实验及结论 | 第49-50页 |
·本章小结 | 第50-51页 |
第5章 说话人识别系统的建立 | 第51-57页 |
·高斯混合模型 (GMM) 的建立 | 第51-54页 |
·GMM 模型定义 | 第51-52页 |
·GMM 模型的初始化 | 第52-53页 |
·得分识别模型 | 第53页 |
·GMM 的识别算法 | 第53-54页 |
·系统介绍 | 第54-56页 |
·系统结构介绍 | 第54页 |
·系统界面介绍 | 第54-56页 |
·本章小结 | 第56-57页 |
第6章 结论 | 第57-58页 |
参考文献 | 第58-62页 |
致谢 | 第62-63页 |
攻读学位期间发表的学术论文及参加科研情况 | 第63-64页 |