摘要 | 第1-4页 |
Abstract | 第4-8页 |
第1章 绪论 | 第8-13页 |
·语音识别概述 | 第8页 |
·语音识别的发展与现状 | 第8-10页 |
·语音识别所面临的问题 | 第10-11页 |
·汉语数码语音识别的意义及面临的问题 | 第11-12页 |
·汉语数码语音识别的意义 | 第11页 |
·汉语数码语音识别所面临的问题 | 第11-12页 |
·论文结构 | 第12-13页 |
第2章 语音识别的基本原理 | 第13-30页 |
·语音识别系统的构成 | 第13页 |
·语音信号的获取 | 第13-14页 |
·语音的产生 | 第13-14页 |
·语音信号的A/D 转换 | 第14页 |
·语音信号的产生模型 | 第14-16页 |
·激励模型 | 第15页 |
·声道模型 | 第15-16页 |
·辐射模型 | 第16页 |
·语音信号的预处理 | 第16-20页 |
·预加重 | 第16-18页 |
·语音信号的分帧加窗处理 | 第18-20页 |
·语音端点检测 | 第20-22页 |
·短时能量和短时过零率 | 第20-21页 |
·基于短时能量和短时过零率的端点检测 | 第21-22页 |
·特征参数提取 | 第22-28页 |
·线性预测倒谱系数LPCC | 第23-26页 |
·Mel 频率倒谱系数MFCC | 第26-28页 |
·MFCC 参数与LPCC 参数对比 | 第28页 |
·本章小节 | 第28-30页 |
第3章 隐马尔可夫模型(HMM) | 第30-41页 |
·隐马尔可夫模型(HMM)的引入 | 第30-31页 |
·隐马尔可夫模型(HMM)的定义 | 第31-32页 |
·信号模型 | 第31页 |
·隐马尔可夫模型的数学描述 | 第31-32页 |
·HMM 的三个基本问题及其解决 | 第32-38页 |
·“前向—后向”算法 | 第32-35页 |
·最佳状态序列的确定(Viterbi 算法) | 第35-36页 |
·Baum-Welch 算法 | 第36-38页 |
·隐马尔可夫模型的类型 | 第38-40页 |
·本章小结 | 第40-41页 |
第4章 HTK 语音识别原理和基于HTK 的语音识别系统搭建 | 第41-58页 |
·HTK 的语音识别原理 | 第41-45页 |
·HTK 的软件结构 | 第42-43页 |
·HTK 工具包 | 第43-45页 |
·基于HTK 的语音识别系统搭建 | 第45-57页 |
·数据准备 | 第46-48页 |
·特征提取 | 第48-49页 |
·识别单元选取 | 第49-50页 |
·汉语离散数码的训练与识别 | 第50-53页 |
·连续数字的训练与识别 | 第53-57页 |
·本章小节 | 第57-58页 |
第5章 实验仿真及性能分析 | 第58-65页 |
·软硬件环境 | 第58页 |
·语音数据库的建立 | 第58-59页 |
·实验一:基于HMM 的汉语离散数码语音识别 | 第59-61页 |
·实验用数据库 | 第59页 |
·具体实现过程 | 第59-60页 |
·实验结果及分析 | 第60-61页 |
·实验二:基于HTK 的汉语离散数码语音识别 | 第61-63页 |
·实验用数据库 | 第61页 |
·具体实现过程 | 第61-62页 |
·实验结果及分析 | 第62-63页 |
·实验三:基于HTK 的汉语连续数字语音识别 | 第63-64页 |
·实验用数据库 | 第63页 |
·具体实现过程 | 第63-64页 |
·实验结果及分析 | 第64页 |
·本章小节 | 第64-65页 |
第6章 总结与展望 | 第65-67页 |
·总结 | 第65-66页 |
·展望 | 第66-67页 |
参考文献 | 第67-70页 |
攻读硕士学位期间发表的论文 | 第70-71页 |
致谢 | 第71-72页 |