弱湍信道下光载声音的声纹识别技术研究
摘要 | 第5-6页 |
abstract | 第6页 |
第一章 绪论 | 第9-19页 |
1.1 语音声纹识别的研究背景 | 第9-11页 |
1.2 声纹识别技术的硏究现状 | 第11-14页 |
1.3 语音声纹识别系统的框架 | 第14-16页 |
1.4 语音声纹识别系统的性能评价指标 | 第16-17页 |
1.5 论文的研究内容 | 第17-18页 |
1.6 论文的结构安排 | 第18-19页 |
第二章 弱湍流信道噪声分析 | 第19-28页 |
2.1 大气湍流现象介绍 | 第19-20页 |
2.1.1 湍流的定义 | 第19-20页 |
2.1.2 湍流的主要特征 | 第20页 |
2.2 大气湍流噪声介绍 | 第20-21页 |
2.3 弱湍信道下采集语音的分析与处理 | 第21-27页 |
2.4 本章小结 | 第27-28页 |
第三章 语音信号预处理与特征提取 | 第28-37页 |
3.1 语音信号预处理 | 第29-34页 |
3.1.1 提取音频文件样本数据 | 第29页 |
3.1.2 预加重 | 第29-30页 |
3.1.3 分帧加窗 | 第30页 |
3.1.4 端点检测 | 第30-34页 |
3.2 语音信号特征提取 | 第34-36页 |
3.2.1 傅里叶变换和梅尔滤波器 | 第34-35页 |
3.2.2 离散余弦变换和一阶差分 | 第35-36页 |
3.3 本章小结 | 第36-37页 |
第四章 基于ANN-VQ模型的声纹识别系统 | 第37-52页 |
4.1 引言 | 第37页 |
4.2 BP神经网络模型算法 | 第37-46页 |
4.2.1 人工神经网络介绍 | 第37-39页 |
4.2.2 人工神经网络特性 | 第39页 |
4.2.3 人工神经网络结构 | 第39-42页 |
4.2.4 BP神经网络训练 | 第42-45页 |
4.2.5 神经网络的过拟合与欠拟合 | 第45-46页 |
4.3 矢量量化算法 | 第46-49页 |
4.3.1 VQ设计问题 | 第47-48页 |
4.3.2 LBG算法 | 第48-49页 |
4.4 基于BP网络的声纹识别基线系统搭建 | 第49-51页 |
4.4.1 矢量量化 | 第49-50页 |
4.4.2 BP网络训练和测试 | 第50页 |
4.4.3 计算余弦距离得分 | 第50-51页 |
4.4.4 分析系统识别性能 | 第51页 |
4.5 本章小结 | 第51-52页 |
第五章 基于TV-Ivec模型的声纹识别系统 | 第52-62页 |
5.1 GMM-UBM的生成 | 第54-58页 |
5.1.1 高斯混合模型GMM | 第54-55页 |
5.1.2 通用背景模型UBM | 第55-58页 |
5.2 TV空间的生成 | 第58-60页 |
5.3 提取I-vector | 第60页 |
5.4 模型匹配 | 第60-61页 |
5.4.1 计算余弦距离得分 | 第60-61页 |
5.4.2 分析系统识别性能 | 第61页 |
5.5 本章小结 | 第61-62页 |
第六章 实验结果与分析 | 第62-67页 |
6.1 实验数据来源与选取 | 第62-63页 |
6.1.1 弱湍信道语音样本库 | 第62页 |
6.1.2 基于ANN-VQ模型的基线系统数据 | 第62页 |
6.1.3 基于TV-Ivec模型的识别系统数据 | 第62-63页 |
6.2 实验参数及结果 | 第63-65页 |
6.3 实验结果分析 | 第65-67页 |
第七章 总结与展望 | 第67-68页 |
致谢 | 第68-69页 |
参考文献 | 第69-70页 |