基于GMM的连接词语音识别及大词汇表系统的语言建模
第一章 引言 | 第1-17页 |
第一节 语音识别概述 | 第8-13页 |
·语音识别的意义 | 第8-9页 |
·语音识别技术的历史和发展现状 | 第9-10页 |
·语音识别技术存在的研究难点 | 第10-11页 |
·语音识别新的发展方向和研究热点 | 第11-13页 |
第二节 本文的研究内容和意义 | 第13-17页 |
·连续数字语音识别 | 第13-15页 |
·大词汇表连续语音识别的语言建模 | 第15-17页 |
第二章 语音信号分析 | 第17-32页 |
第一节 语音信号处理的基本知识 | 第17-21页 |
·语言、语音学知识 | 第17页 |
·音节、音素和声调 | 第17-19页 |
·语音的特性分析 | 第19-21页 |
第二节 语音信号的参数提取 | 第21-27页 |
·NIST、WAVE 文件格式 | 第21-23页 |
·语音信号预处理 | 第23-24页 |
·MFCC 特征参数的提取 | 第24-27页 |
第三节 语音信号的端点检测 | 第27-32页 |
·短时能量、能跨积检测语音端点 | 第28-29页 |
·对数能量参数检测语音端点 | 第29-30页 |
·Running Sum 方法改进均值的求法 | 第30-32页 |
第三章 基于GMM 的连续数字识别系统 | 第32-57页 |
第一节 隐Markov 模型 | 第32-35页 |
·隐Markov 模型概述 | 第32-35页 |
·有限状态机 | 第35页 |
第二节 Gaussian 混合模型 | 第35-39页 |
·Gaussian 混合模型概述 | 第35-38页 |
·EM 算法的参数重估计 | 第38-39页 |
第三节 连续数字语音识别器的系统概貌 | 第39-41页 |
第四节 训练和参数估计模块的实现 | 第41-53页 |
·Markov 自动机的实现 | 第41-42页 |
·线性与非线性时间对齐 | 第42-48页 |
·EM 算法对GMM 参数重估计的实现 | 第48-52页 |
·训练过程的实现 | 第52-53页 |
第五节 识别模块的实现 | 第53-55页 |
第六节 实验结果与分析 | 第55-57页 |
第四章 语言建模 | 第57-73页 |
第一节 语言模型概述 | 第57-63页 |
·大词汇表连续语音识别的语言建模 | 第57-58页 |
·N-Gram 语言模型 | 第58-59页 |
·语言模型的参数估计 | 第59-61页 |
·语言模型的性能评测 | 第61-62页 |
·语言建模时出现的问题 | 第62-63页 |
第二节 语言建模的平滑技术 | 第63-68页 |
·平滑技术概要 | 第63页 |
·线性平滑 | 第63-66页 |
·Kneser-Ney 平滑 | 第66-68页 |
第三节 语言建模的实验 | 第68-73页 |
·所用的工具和语言 | 第68-69页 |
·待处理数据和运行环境 | 第69-70页 |
·实验结果与分析 | 第70-73页 |
第五章 结束语 | 第73-74页 |
参考文献 | 第74-76页 |
攻读学位期间发表的论文 | 第76-77页 |
致谢 | 第77-78页 |
详细摘要 | 第78-80页 |