摘要 | 第4-5页 |
abstract | 第5-6页 |
第1章 绪论 | 第9-17页 |
1.1 课题来源 | 第9页 |
1.2 课题研究的背景及意义 | 第9-10页 |
1.3 国内外研究现状 | 第10-14页 |
1.4 本文研究的主要内容 | 第14-17页 |
第2章 病理嗓音的声学特征提取与分析 | 第17-34页 |
2.1 病理嗓音数据库及特征提取概述 | 第17-18页 |
2.2 嗓音信号预处理 | 第18-20页 |
2.3 多维基础声学特征提取 | 第20-30页 |
2.3.1 传统声学特征分析 | 第20-22页 |
2.3.2 谐噪比类声学特征提取 | 第22-25页 |
2.3.3 非动力学类特征提取 | 第25-30页 |
2.4 频谱类特征提取 | 第30-33页 |
2.4.1 基于同态分析的倒谱参数 | 第30-32页 |
2.4.2 基于长时频谱分析 | 第32-33页 |
2.5 本章小结 | 第33-34页 |
第3章 持续元音的四分类系统实现及改进 | 第34-55页 |
3.1 基于调制变换的特征提取 | 第34-40页 |
3.1.1 调制谱的概念 | 第34-35页 |
3.1.2 调制变换 | 第35-37页 |
3.1.3 基于调制变换的特征提取 | 第37-40页 |
3.2 基于构音器官的运动特征提取 | 第40-44页 |
3.2.1 基于声学元音图的特征 | 第40-41页 |
3.2.2 构音器官的发音特征 | 第41-44页 |
3.3 MS特征用于提高分类效果的实验验证 | 第44-49页 |
3.3.1 持续元音四分类系统的设计 | 第44-46页 |
3.3.2 基于MS特征的分类系统的设计与实现 | 第46-47页 |
3.3.3 实验结果与分析 | 第47-49页 |
3.4 构音器官运动特征用于提高区分度的实验验证 | 第49-53页 |
3.4.1 数据采集对象筛选 | 第49页 |
3.4.2 声学和运动学信号采集 | 第49-50页 |
3.4.3 实验结果与分析 | 第50-53页 |
3.5 本章小结 | 第53-55页 |
第4章 连续语段的四分类系统实现及改进 | 第55-72页 |
4.1 基于DBN-DNN模型的分类算法 | 第55-63页 |
4.1.1 DBN-DNN网络结构 | 第55-59页 |
4.1.2 DBN-DNN训练 | 第59-63页 |
4.2 基于DBN-DNN模型的分类系统的设计和实现 | 第63-65页 |
4.2.1 DBN-DNN用于分类的建模 | 第63-64页 |
4.2.2 实验结果与分析 | 第64-65页 |
4.3 基于谱特征合成提高分类效果的实验验证 | 第65-67页 |
4.3.1 谱特征的合成及其提高分类效果的实验设计 | 第65-66页 |
4.3.2 实验结果与分析 | 第66-67页 |
4.4 基于ASR预测嗓音障碍等级 | 第67-71页 |
4.4.1 DNN-HMM模型 | 第67-69页 |
4.4.2 DNN-HMM的训练 | 第69-70页 |
4.4.3 病理嗓音的ASR识别率 | 第70页 |
4.4.4 基于DNN-HMM预测嗓音障碍等级 | 第70-71页 |
4.5 本章总结 | 第71-72页 |
第5章 研究总结与展望 | 第72-74页 |
5.1 论文工作总结 | 第72-73页 |
5.2 未来工作展望 | 第73-74页 |
致谢 | 第74-75页 |
参考文献 | 第75-79页 |
攻读学位期间获得与学位论文相关的科研成果目录 | 第79页 |