摘要 | 第1-4页 |
ABSTRACT | 第4-11页 |
第一章 引言 | 第11-16页 |
1.1 说话人识别技术概述 | 第11-12页 |
1.2 说话人识别中的问题 | 第12-13页 |
1.3 情感语音对说话人识别的影响 | 第13-14页 |
1.4 研究意义 | 第14-15页 |
1.5 本文内容安排 | 第15-16页 |
第二章 说话人识别与语音库 | 第16-35页 |
2.1 说话人识别原理 | 第16-17页 |
2.2 说话人识别系统框架 | 第17-23页 |
2.2.1 特征提取 | 第18-21页 |
2.2.2 说话人识别模型 | 第21-23页 |
2.3 实验语音数据库介绍 | 第23-34页 |
2.3.1 情感语音库现状 | 第24-26页 |
2.3.2 EPST语音数据库 | 第26-28页 |
2.3.3 MASC@CCNT语音数据库的设计和建立 | 第28-34页 |
2.4 基本参数设置 | 第34页 |
2.5 本章小结 | 第34-35页 |
第三章 存在情感影响的说话人识别研究现状 | 第35-39页 |
3.1 情感分类和情感特征分析 | 第35-38页 |
3.1.1 情感的分类 | 第35-36页 |
3.1.2 语音信号中的情感特征 | 第36页 |
3.1.3 基音频率 | 第36页 |
3.1.4 发音持续时间 | 第36页 |
3.1.5 能量 | 第36-37页 |
3.1.6 共振峰 | 第37页 |
3.1.7 韵律特征 | 第37页 |
3.1.8 语音特征 | 第37页 |
3.1.9 词汇和对话特征 | 第37-38页 |
3.2 存在情感影响的说话人识别系统 | 第38页 |
3.3 本章小结 | 第38-39页 |
第四章 语音的情感特征变化及中西情感表达差异的研究 | 第39-50页 |
4.1 情感分析用语料的选择 | 第39-40页 |
4.2 分析方法和参数选择 | 第40-41页 |
4.2.1 基音频率 | 第40页 |
4.2.2 语音持续时间比较 | 第40-41页 |
4.2.3 元音共振峰分析 | 第41页 |
4.2.4 能量分析 | 第41页 |
4.3 分析结果 | 第41-47页 |
4.3.1 基音频率的分析结果 | 第41-42页 |
4.3.2 语音持续时间的分析结果 | 第42-43页 |
4.3.3 元音共振峰分析的结果 | 第43-46页 |
4.3.4 能量分析的结果 | 第46-47页 |
4.4 结论 | 第47-49页 |
4.5 本章小结 | 第49-50页 |
第五章 基于情感语音归类的结构化训练方法 | 第50-58页 |
5.1 基本思想 | 第50页 |
5.2 特征的统计分析 | 第50-52页 |
5.2.1 语音特征参数 | 第50-51页 |
5.2.2 统计分析 | 第51-52页 |
5.3 情感的划归和分类 | 第52-54页 |
5.4 结构化训练方法 | 第54-56页 |
5.4.1 实验策略 | 第54-55页 |
5.4.2 实验结果及其分析 | 第55-56页 |
5.5 本章小结 | 第56-58页 |
第六章 基于倒谱特征线性情感补偿的说话人识别 | 第58-66页 |
6.1 基本思想 | 第58页 |
6.2 情感影响下基音频率与倒谱特征的变化 | 第58-59页 |
6.3 基于倒谱特征的情感补偿模型 | 第59-61页 |
6.4 基于倒谱特征的情感补偿算法 | 第61-63页 |
6.4.1 倒谱特征补偿 | 第61页 |
6.4.2 影响因子的选取 | 第61-63页 |
6.5 实验结果及其分析 | 第63-65页 |
6.6 本章小结 | 第65-66页 |
第七章 总结与展望 | 第66-69页 |
7.1 作总结 | 第66-67页 |
7.2 讨论与展望 | 第67-69页 |
文中涉及的情感相关词汇中英对照 | 第69-70页 |
参考文献 | 第70-76页 |
攻读硕士学位期间的研究成果 | 第76-77页 |
致谢 | 第77页 |