基于稀疏编码的鲁棒说话人识别方法研究
摘要 | 第5-7页 |
Abstract | 第7-9页 |
第1章 绪论 | 第13-29页 |
1.1 课题研究的背景和意义 | 第13-14页 |
1.2 国内外研究现状 | 第14-26页 |
1.2.1 说话人识别发展历史 | 第15-16页 |
1.2.2 说话人识别的研究方法及研究现状 | 第16-26页 |
1.3 说话人识别存在的问题 | 第26-27页 |
1.4 课题来源及主要研究内容 | 第27-29页 |
1.4.1 课题来源 | 第27页 |
1.4.2 主要研究内容 | 第27-29页 |
第2章 说话人识别相关技术概述 | 第29-54页 |
2.1 说话人识别基本体系框架 | 第29-42页 |
2.1.1 预处理 | 第29-30页 |
2.1.2 语音活动检测 | 第30-31页 |
2.1.3 特征提取 | 第31-37页 |
2.1.4 识别模型 | 第37-42页 |
2.1.5 阈值选择(得分判决) | 第42页 |
2.2 GMM-UBM体系框架 | 第42-47页 |
2.2.1 模型训练 | 第43-45页 |
2.2.2 识别算法 | 第45-46页 |
2.2.3 冒充者拒识 | 第46-47页 |
2.3 SVM说话人识别 | 第47-50页 |
2.4 稀疏编码概述 | 第50-53页 |
2.4.1 稀疏性 | 第51-52页 |
2.4.2 稀疏表示 | 第52-53页 |
2.5 本章小结 | 第53-54页 |
第3章 两种稀疏编码方法重构误差分析 | 第54-71页 |
3.1 引言 | 第54-55页 |
3.2 稀疏编码 | 第55-61页 |
3.2.1 字典构建 | 第55-57页 |
3.2.2 稀疏分解算法 | 第57-61页 |
3.2.3 信号重构 | 第61页 |
3.3 两种稀疏编码方法 | 第61-63页 |
3.4 重构误差分析 | 第63-66页 |
3.5 实验与分析 | 第66-70页 |
3.6 本章小结 | 第70-71页 |
第4章 噪声环境下基于稀疏编码的语音活动检测 | 第71-84页 |
4.1 引言 | 第71-72页 |
4.2 基于稀疏编码的语音活动检测 | 第72-74页 |
4.2.1 特征提取 | 第73-74页 |
4.2.2 GMM模型训练和噪声GMM模型 | 第74页 |
4.3 字典训练 | 第74-75页 |
4.4 稀疏分解、字典拼接和门限判定 | 第75-76页 |
4.5 实验与分析 | 第76-83页 |
4.6 本章小结 | 第83-84页 |
第5章 鲁棒说话人识别特征提取 | 第84-100页 |
5.1 引言 | 第84-85页 |
5.2 PMVDR特征提取 | 第85-87页 |
5.3 GMM系统设置 | 第87-88页 |
5.4 基于稀疏编码的特征提取 | 第88-93页 |
5.4.1 噪声建模 | 第88页 |
5.4.2 鲁棒特征提取 | 第88-93页 |
5.5 PMVDR-SDC特征实验与分析 | 第93-96页 |
5.5.1 弯折系数的优化 | 第94页 |
5.5.2 PMVDR-SDC实验与分析 | 第94-96页 |
5.6 稀疏特征实验与分析 | 第96-99页 |
5.6.1 实验配置 | 第96页 |
5.6.2 数据准备 | 第96-97页 |
5.6.3 实验与分析 | 第97-99页 |
5.7 本章小结 | 第99-100页 |
第6章 两阶段稀疏编码的说话人识别 | 第100-108页 |
6.1 引言 | 第100-101页 |
6.2 识别框架 | 第101-102页 |
6.3 第一阶段稀疏分解 | 第102-104页 |
6.4 第二阶段稀疏分解 | 第104页 |
6.5 实验与分析 | 第104-107页 |
6.6 本章小结 | 第107-108页 |
结论 | 第108-110页 |
参考文献 | 第110-122页 |
攻读博士学位期间发表的学术论文 | 第122-123页 |
致谢 | 第123页 |