摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第8-15页 |
1.1 研究背景 | 第8-11页 |
1.1.1 说话人识别介绍 | 第8-9页 |
1.1.2 说话人识别优势与应用前景 | 第9-11页 |
1.2 研究进展 | 第11-13页 |
1.2.1 国内外研究现状 | 第11-12页 |
1.2.2 存在的问题 | 第12-13页 |
1.3 论文研究主要内容 | 第13-14页 |
1.4 论文研究结构安排 | 第14-15页 |
第二章 说话人的个性特征分析 | 第15-22页 |
2.1 语音产生机理 | 第15-16页 |
2.1.1 说话人个性特征基于发声机理 | 第15-16页 |
2.1.2 说话人个性信息在语音信号中分布 | 第16页 |
2.2 说话人识别特征参数提取 | 第16-22页 |
2.2.1 说话人识别系统结构 | 第16-18页 |
2.2.2 梅尔倒谱系数提取 | 第18-22页 |
第三章 数据采集与处理 | 第22-30页 |
3.1 中文说话人识别标准语料库 | 第22-24页 |
3.1.1 标准语料库采集 | 第22页 |
3.1.2 中文音素标注语料库制作方法 | 第22-24页 |
3.2 中文普通话 MRI 数据库 | 第24-30页 |
3.2.1 静态二维数据 | 第24-26页 |
3.2.2 静态三维数据 | 第26页 |
3.2.3 MRI 数据采集 | 第26-27页 |
3.2.4 阈值分割 | 第27-29页 |
3.2.5 面积函数提取 | 第29-30页 |
第四章 实验分析 | 第30-39页 |
4.1 说话人识别实验 | 第30-32页 |
4.1.1 提取特征参数的重要性 | 第30页 |
4.1.2 基于 F-ratio 统计方法的说话人特征提取 | 第30-31页 |
4.1.3 基于音素平均方法的汉语说话人特征提取 | 第31-32页 |
4.2 汉语中说话人信息在不同频带的分布特性 | 第32-35页 |
4.3 基于 F-ratio 贡献率的非线性频率尺度变换 | 第35-37页 |
4.3.1 均匀子带滤波器输出 | 第35-36页 |
4.3.2 基于音素平均贡献率的非线性频率尺度变换 | 第36-37页 |
4.4 说话人识别性能分析 | 第37-39页 |
4.4.1 说话人特征参数提取 | 第37页 |
4.4.2 说话人识别实验 | 第37-39页 |
第五章 鼻音及非鼻音的软腭耦合分析 | 第39-60页 |
5.1 鼻腔介绍 | 第39-42页 |
5.1.1 鼻腔语音作用 | 第39-40页 |
5.1.2 鼻腔结构 | 第40-42页 |
5.2 鼻腔形态学及声学的个性差异 | 第42-46页 |
5.2.1 鼻腔形态个性化差异 | 第43-46页 |
5.3 鼻腔声学分析 | 第46-53页 |
5.3.1 副鼻腔的测量 | 第46-49页 |
5.3.2 声学分析 | 第49-53页 |
5.4 非鼻音中的软腭耦合研究 | 第53-60页 |
5.4.1 软口腭耦合介绍 | 第53-54页 |
5.4.2 实验原理及过程 | 第54-55页 |
5.4.3 元音中的鼻音现象 | 第55页 |
5.4.4 有声子音的产生 | 第55-60页 |
第六章 总结与展望 | 第60-61页 |
参考文献 | 第61-64页 |
发表论文和参加科研情况说明 | 第64-65页 |
致谢 | 第65页 |