摘要 | 第5-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第14-22页 |
1.1 引言 | 第14-15页 |
1.2 说话人识别简介 | 第15-17页 |
1.3 测试语音失配问题的解决方法 | 第17-18页 |
1.4 情感说话人识别面临的主要问题及目前的解决办法 | 第18-20页 |
1.5 本文的主要研究工作 | 第20-22页 |
第2章 说话人识别概率模型算法简介 | 第22-35页 |
2.1 简介 | 第22页 |
2.2 语音特征提取 | 第22-25页 |
2.2.1 MFCC特征 | 第23-25页 |
2.3 基于概率模型推断的说话人识别 | 第25-34页 |
2.3.1 高斯混合模型 | 第27-28页 |
2.3.2 通用背景模型 | 第28-30页 |
2.3.3 联合因子分析 | 第30-32页 |
2.3.4 基于I-Vector特征的模型 | 第32-34页 |
2.4 本章小结 | 第34-35页 |
第3章 情感说话人识别 | 第35-43页 |
3.1 情感变化对说话人识别算法的影响 | 第35-38页 |
3.1.1 信道失配问题概述 | 第35-36页 |
3.1.2 情感失配情况下的说话人识别效率 | 第36-38页 |
3.2 情感失配的分析与表达 | 第38-39页 |
3.2.1 情感变换的规律 | 第38-39页 |
3.2.2 情感说话人识别的处理方法 | 第39页 |
3.3 基于模型合成的情感说话人识别系统 | 第39-42页 |
3.3.1 问题说明 | 第39-42页 |
3.3.2 已有算法的不足 | 第42页 |
3.4 本章小结 | 第42-43页 |
第4章 情感变化幅度的概率模型 | 第43-56页 |
4.1 简介 | 第43页 |
4.2 新奇检测 | 第43-47页 |
4.2.1 离群点检测 | 第44-45页 |
4.2.2 新奇度判别算法 | 第45-47页 |
4.3 贝叶斯差异 | 第47-49页 |
4.3.1 指数分布族的贝叶斯差异计算 | 第48页 |
4.3.2 高斯分布和高斯混合模型贝叶斯差异的计算 | 第48-49页 |
4.4 稳定贝叶斯差异 | 第49-52页 |
4.4.1 AIC | 第50-51页 |
4.4.2 AIC相关的准则 | 第51页 |
4.4.3 BIC | 第51-52页 |
4.4.4 AIC和BIC的比较 | 第52页 |
4.5 说话人识别实验 | 第52-55页 |
4.5.1 单高斯模型统计距离分类 | 第53-54页 |
4.5.2 高斯混合模型的统计距离分类 | 第54-55页 |
4.6 本章小结 | 第55-56页 |
第5章 说话人情感模型合成 | 第56-61页 |
5.1 简介 | 第56页 |
5.2 GMM模型均值合成 | 第56-57页 |
5.3 最优线性GMM均值合成 | 第57-59页 |
5.3.1 局部线性映射 | 第57-58页 |
5.3.2 基于LLM的情感模型合成 | 第58-59页 |
5.4 实验结果 | 第59-60页 |
5.4.1 实验数据库 | 第59页 |
5.4.2 均值合成算法 | 第59-60页 |
5.5 本章小结 | 第60-61页 |
第6章 贝叶斯因子分析与情感特征合成 | 第61-72页 |
6.1 简介 | 第61-62页 |
6.1.1 JFA及相关算法的局限性 | 第61-62页 |
6.1.2 改进JFA的鲁棒性 | 第62页 |
6.2 贝叶斯因子分析 | 第62-64页 |
6.2.1 基本模型 | 第62-63页 |
6.2.2 非参数模型 | 第63-64页 |
6.3 贝叶斯稀疏因子模型 | 第64-67页 |
6.3.1 基于IBP的非参数隐含特征模型 | 第65页 |
6.3.2 吉布斯采样 | 第65-66页 |
6.3.3 变分推导 | 第66-67页 |
6.4 基于稀疏字典的情感因子重建 | 第67-68页 |
6.5 实验结果 | 第68-70页 |
6.5.1 NIST测试 | 第68页 |
6.5.2 MASC测试 | 第68-70页 |
6.6 本章小结 | 第70-72页 |
第7章 总结与展望 | 第72-76页 |
7.1 总结 | 第72-74页 |
7.2 未来工作展望 | 第74-76页 |
参考文献 | 第76-86页 |
致谢 | 第86页 |