说话人识别系统的研究及DSP实现
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-11页 |
| 第1章 绪论 | 第11-17页 |
| ·说话人识别技术概述 | 第11-12页 |
| ·说话人识别关键技术 | 第12-13页 |
| ·说话人识别的研究现状 | 第13-14页 |
| ·说话人识别技术的分类 | 第14-15页 |
| ·辨认和确认 | 第14页 |
| ·文本相关和文本无关 | 第14-15页 |
| ·开集识别和闭集识别 | 第15页 |
| ·说话人识别和语音识别的联系 | 第15页 |
| ·本文研究的主要内容和结构安排 | 第15-17页 |
| 第2章 说话人识别的主要技术 | 第17-28页 |
| ·语音信号产生模型 | 第17-18页 |
| ·语音信号预处理 | 第18-20页 |
| ·语音信号的数字化 | 第18-19页 |
| ·预加重 | 第19页 |
| ·分帧 | 第19-20页 |
| ·加窗 | 第20页 |
| ·语音信号的时域分析 | 第20-22页 |
| ·短时能量 | 第20-21页 |
| ·短时平均幅值 | 第21页 |
| ·短时平均过零率 | 第21页 |
| ·短时自相关函数 | 第21-22页 |
| ·短时平均幅度差函数 | 第22页 |
| ·语音的特征提取 | 第22-25页 |
| ·基音周期 | 第23页 |
| ·线性预测系数 | 第23-24页 |
| ·美尔倒谱系数 | 第24-25页 |
| ·说话人识别方法 | 第25-27页 |
| ·识别方法分类 | 第25页 |
| ·基于DTW的说话人识别 | 第25-26页 |
| ·基于VQ的说话人识别 | 第26-27页 |
| ·基于隐马尔可夫模型的说话人识别 | 第27页 |
| ·基于人工神经网络的说话人识别 | 第27页 |
| ·本章小结 | 第27-28页 |
| 第3章 说话人多参数组合特征的研究 | 第28-44页 |
| ·常用单一主流特征 | 第28-33页 |
| ·LPC特征 | 第29-30页 |
| ·LPCC特征 | 第30-32页 |
| ·MFCC特征 | 第32-33页 |
| ·二次特征提取 | 第33-37页 |
| ·特征加权 | 第34页 |
| ·特征微分 | 第34-36页 |
| ·特征组合 | 第36页 |
| ·特征筛选 | 第36-37页 |
| ·多参数组合特征性能分析 | 第37-42页 |
| ·单一特征维数的影响实验 | 第37-39页 |
| ·单一特征动静态组合实验 | 第39-40页 |
| ·不同特征组合实验 | 第40-41页 |
| ·仿真实验及结果分析 | 第41-42页 |
| ·本章小结 | 第42-44页 |
| 第4章 带噪语音的端点检测 | 第44-55页 |
| ·扩展谱相减 | 第44-50页 |
| ·谱相减基本原理 | 第44-45页 |
| ·标准维纳滤波器 | 第45-50页 |
| ·基于非语音段概率(SAP)软门限的端点检测 | 第50-52页 |
| ·非语音段概率SAP | 第50-51页 |
| ·SAP软门限的动态更新 | 第51-52页 |
| ·仿真实验及结果分析 | 第52-53页 |
| ·本章小结 | 第53-55页 |
| 第5章 说话人识别仿真开发系统 | 第55-63页 |
| ·仿真开发系统实现的硬件平台 | 第55-59页 |
| ·TMS320C54x概况 | 第55-57页 |
| ·说话人识别的系统平台 | 第57-59页 |
| ·集成开发环境CCS | 第59-62页 |
| ·系统调试过程 | 第62页 |
| ·系统测试及相关结果 | 第62-63页 |
| 结论 | 第63-65页 |
| 参考文献 | 第65-69页 |
| 攻读硕士学位期间发表的论文和取得的科研成果 | 第69-70页 |
| 致谢 | 第70-71页 |
| 个人简历 | 第71页 |