基于帧级和段级稀疏表示的说话人识别研究

摘要	第4-6页
Abstract	第6-7页
第1章绪论	第14-25页
1.1 课题研究目的及意义	第14-15页
1.2 国内外研究现状	第15-21页
1.2.1 经典的说话人识别方法	第15-17页
1.2.2 基于稀疏表示的说话人识别方法	第17-21页
1.3 目前存在的主要问题	第21-22页
1.4 本文主要研究内容	第22-25页
第2章稀疏表示和说话人识别	第25-43页
2.1 引言	第25-26页
2.2 稀疏表示理论	第26-30页
2.2.1 稀疏分解	第28-29页
2.2.2 字典学习	第29-30页
2.3 说话人识别系统的基本组成	第30-40页
2.3.1 特征提取	第30-37页
2.3.2 模型训练	第37-39页
2.3.3 模型匹配	第39页
2.3.4 融合信息	第39-40页
2.4 说话人识别系统的评价指标	第40页
2.5 说话人识别系统的语料库	第40-42页
2.6 本章小结	第42-43页
第3章基于帧级字典原子活跃度模型的说话人识别	第43-57页
3.1 引言	第43-44页
3.2 原子活跃度模型的构建	第44-48页
3.2.1 字典原子激活状态表示	第44-45页
3.2.2 峰度	第45-46页
3.2.3 字典原子活跃度模型	第46-48页
3.3 动态阈值确定	第48-51页
3.4 实验结果与分析	第51-55页
3.5 本章小结	第55-57页
第4章基于帧级联合字典和系数池化鲁棒说话人识别	第57-81页
4.1 引言	第57-58页
4.2 基于语音和噪声联合字典的稀疏表示	第58-62页
4.3 基于稀疏表示的池化特征	第62-66页
4.3.1 最大值池化操作	第63-64页
4.3.2 平均值池化操作	第64-66页
4.4 余弦相似度判决准则	第66-67页
4.5 实验结果与分析	第67-80页
4.5.1 最大值池化操作结果评估	第67-76页
4.5.2 平均值池化操作结果评估	第76-80页
4.6 本章小结	第80-81页
第5章基于段级字典判别性学习的说话人识别	第81-98页
5.1 引言	第81-82页
5.2 Fisher准则	第82-84页
5.3 Fisher判别字典学习	第84-91页
5.3.1 简化FDDL模型	第85-87页
5.3.2 优化FDDL模型	第87-91页
5.4 基于FDDL的说话人识别	第91-92页
5.5 实验结果与分析	第92-96页
5.5.1 基于FDDL的说话人识别系统	第93-94页
5.5.2 基于i-CDS和FDDL融合的说话人识别系统	第94-95页
5.5.3 不同判别字典学习方法的对比	第95-96页
5.6 本章小结	第96-98页
第6章基于块稀疏贝叶斯分解的说话人识别	第98-112页
6.1 引言	第98-99页
6.2 稀疏贝叶斯	第99-103页
6.3 块稀疏贝叶斯	第103-105页
6.4 基于块稀疏贝叶斯分解的说话人识别	第105-108页
6.4.1 字典构成	第106页
6.4.2 块稀疏贝叶斯分解	第106-108页
6.5 实验结果与分析	第108-111页
6.6 本章小结	第111-112页
结论	第112-114页
参考文献	第114-125页
攻读博士学位期间发表的论文及其它成果	第125-127页
致谢	第127-128页
个人简历	第128页