噪声环境下汉语数字语音识别系统的研究
摘要 | 第1-9页 |
ABSTRACT | 第9-10页 |
第1章绪论 | 第10-18页 |
1. 1语音识别概述 | 第10-15页 |
1. 1. 1语音识别发展及现状 | 第10-12页 |
1. 1. 2语音识别的分类及系统描述 | 第12-13页 |
1. 1. 3语音识别的主要算法 | 第13-14页 |
1. 1. 4语音识别系统的应用 | 第14-15页 |
1. 2抗噪语音识别概述 | 第15-17页 |
1. 2. 1语音增强 | 第15-16页 |
1. 2. 2特征参数提取 | 第16页 |
1. 2. 3端点检测 | 第16页 |
1. 2. 4鲁棒性识别模型 | 第16-17页 |
1. 3论文的主要研究内容 | 第17-18页 |
第2章语音信号处理基础 | 第18-30页 |
2. 1语音信号的特点与模型 | 第18-20页 |
2. 1. 1特点 | 第18-19页 |
2. 1. 2产生模型 | 第19-20页 |
2. 2语音信号的数字化和预处理 | 第20-22页 |
2. 2. 1语音信号数字化 | 第20页 |
2. 2. 2预处理 | 第20-22页 |
2. 3时域分析 | 第22-24页 |
2. 3. 1短时能量与短时平均幅度 | 第22-23页 |
2. 3. 2短时过零率 | 第23页 |
2. 3. 3谱熵 | 第23-24页 |
2. 4端点检测 | 第24-30页 |
2. 4. 1传统的双门限端点检测算法 | 第25页 |
2. 4. 2谱熵能量端点检测算法 | 第25-27页 |
2. 4. 3实验分析 | 第27-30页 |
第3章语音增强 | 第30-47页 |
3. 1噪声的特性 | 第30-33页 |
3. 2谱减法 | 第33-40页 |
3. 2. 1维纳滤波 | 第33-34页 |
3. 2. 2噪音能量谱密度估计的谱减法 | 第34-37页 |
3. 2. 3基于噪音能量谱减法的二次去噪 | 第37-38页 |
3. 2. 4小波滤波 | 第38-40页 |
3. 3实验分析 | 第40-43页 |
3. 4有色噪声的探讨 | 第43-47页 |
3. 4. 1模糊滤波技术 | 第43-47页 |
第4章特征提取 | 第47-58页 |
4. 1LPC分析 | 第47-49页 |
4. 1. 1基本原理 | 第48页 |
4. 1. 2算法介绍 | 第48-49页 |
4. 1. 3阶数p的考虑 | 第49页 |
4. 2线性预测倒谱系数(LPCC) | 第49-50页 |
4. 2. 1基本原理 | 第49-50页 |
4. 2. 2LPCC算法 | 第50页 |
4. 3MFCC分析 | 第50-55页 |
4. 3. 1MFCC参数提取 | 第51-53页 |
4. 3. 2抗噪性参数的选择 | 第53-55页 |
4. 4实验分析 | 第55-58页 |
第5章隐马尔可夫模型 | 第58-74页 |
5. 1HMM的物理含义 | 第58页 |
5. 2HMM模型 | 第58-61页 |
5. 3HMM算法介绍 | 第61-68页 |
5. 3. 1概率估计 | 第62-64页 |
5. 3. 2Viterbi算法 | 第64-66页 |
5. 3. 3Baum-Welch算法 | 第66-68页 |
5. 4求解中的具体问题及解决方案 | 第68-74页 |
5. 4. 1多观察序列的无溢出训练算法 | 第68-70页 |
5. 4. 2参数初值估计 | 第70-72页 |
5. 4. 3混合度与状态数的选择 | 第72页 |
5. 4. 4HMM模型抗噪 | 第72-73页 |
5. 4. 5实验分析 | 第73-74页 |
第6章系统仿真 | 第74-84页 |
6. 1系统组成 | 第74-75页 |
6. 2系统介绍 | 第75-80页 |
6. 2. 1样本数据库的建立 | 第75页 |
6. 2. 2训练语音录入 | 第75页 |
6. 2. 3测试语音录入 | 第75-76页 |
6. 2. 4去噪比较 | 第76-77页 |
6. 2. 5端点检测 | 第77页 |
6. 2. 6时域分析 | 第77-78页 |
6. 2. 7频谱分析 | 第78页 |
6. 2. 8训练与识别流程 | 第78-80页 |
6. 3实验分析 | 第80-84页 |
第7章结论与展望 | 第84-85页 |
致谢 | 第85-86页 |
参考文献 | 第86-89页 |
攻读硕士学位期间发表和录用的论文 | 第89页 |