第1章 绪论 | 第1-34页 |
1.1 选题的目的和意义 | 第13-15页 |
1.2 语音识别的基本概念和相关理论 | 第15-26页 |
1.2.1 语音识别的基本概念 | 第15-16页 |
1.2.2 语音识别原理和系统的组成 | 第16-23页 |
1.2.3 语音信号分析及特征提取 | 第23-26页 |
1.3 语音识别技术的发展和现状 | 第26-30页 |
1.3.1 国际语音识别技术的发展 | 第26-29页 |
1.3.2 国内语音识别技术的发展 | 第29-30页 |
1.4 目前存在的问题和发展方向 | 第30-32页 |
1.5 本文主要研究内容 | 第32-34页 |
第2章 语音识别特征参数的提取 | 第34-52页 |
2.1 引言 | 第34页 |
2.2 线性预测倒谱系数(LPCC)的求解 | 第34-41页 |
2.2.1 线性预测倒谱系数(LPCC)分析 | 第34-40页 |
2.2.2 仿真实验 | 第40-41页 |
2.3 MFCC参数的快速提取算法 | 第41-44页 |
2.3.1 MFCC参数分析 | 第41-44页 |
2.3.2 仿真实验 | 第44页 |
2.4 线谱频率参数的快速提取算法 | 第44-51页 |
2.4.1 线谱频率分析 | 第45-46页 |
2.4.2 求解线谱频率的常用算法 | 第46-47页 |
2.4.3 求解线谱频率的快速算法 | 第47-50页 |
2.4.4 仿真实验 | 第50-51页 |
2.5 本章小结 | 第51-52页 |
第3章 神经网络语音识别算法 | 第52-77页 |
3.1 引言 | 第52-53页 |
3.2 基于 HMM和 SOFM混合模型的语音识别 | 第53-66页 |
3.2.1 隐马尔可夫模型 | 第54-61页 |
3.2.2 自组织特征映射神经网络 | 第61-64页 |
3.2.3 HMM与 SOFM混合模型 | 第64-65页 |
3.2.4 仿真实验 | 第65-66页 |
3.3 模糊神经网络语音识别 | 第66-75页 |
3.3.1 模糊理论 | 第66-67页 |
3.3.2 模糊神经网络 | 第67-69页 |
3.3.3 模糊神经网络语音识别 | 第69-71页 |
3.3.4 BP神经网络 | 第71-72页 |
3.3.5 仿真实验 | 第72-75页 |
3.4 CDHMM/SOFM与模糊神经网络分类模型比较 | 第75-76页 |
3.5 本章小结 | 第76-77页 |
第4章 基于神经网络的说话人识别 | 第77-98页 |
4.1 引言 | 第77-79页 |
4.2 基于 SOFM-PNN混合模型的说话人识别 | 第79-87页 |
4.2.1 GMM分类器 | 第79-82页 |
4.2.2 概率神经网络 | 第82-84页 |
4.2.3 SOFM-PNN混合神经网络分类器 | 第84-85页 |
4.2.4 仿真实验 | 第85-87页 |
4.3 基于遗传神经网络的说话人识别 | 第87-96页 |
4.3.1 遗传算法 | 第88-89页 |
4.3.2 矢量量化 | 第89-92页 |
4.3.3 遗传矢量量化(GAVQ)算法 | 第92-93页 |
4.3.4 RBF神经网络及遗传 RBF神经网络 | 第93-95页 |
4.3.5 仿真实验 | 第95-96页 |
4.4 SOFM-PNN与GA-RBF的比较 | 第96-97页 |
4.5 本章小结 | 第97-98页 |
第5章 基于机理隐马尔可夫模型的语音识别 | 第98-113页 |
5.1 引言 | 第98-99页 |
5.2 齐次隐马尔可夫模型的局限性 | 第99-100页 |
5.3 Baum-Welch迭代算法的分析 | 第100-102页 |
5.4 依据发音机理来建立 MBHMM参数模型 | 第102-106页 |
5.4.1 依据发音机理来确定非齐次的A_ij(n)参数模型 | 第102-106页 |
5.4.2 构建B_ij参数模型的方法 | 第106页 |
5.5 若干参数选择的讨论 | 第106-109页 |
5.5.1 切分段数的讨论 | 第106-108页 |
5.5.2 音元状态个数选择的讨论 | 第108页 |
5.5.3 飘动位数的讨论 | 第108-109页 |
5.6 计算程序框图 | 第109-110页 |
5.7 仿真实验 | 第110-112页 |
5.8 本章小结 | 第112-113页 |
结论 | 第113-116页 |
参考文献 | 第116-128页 |
攻读博士学位期间发表的论文 | 第128-130页 |
致谢 | 第130-131页 |
个人简历 | 第131页 |