摘要 | 第4-5页 |
Abstract | 第5页 |
第1章 绪论 | 第8-14页 |
1.1 课题背景 | 第8页 |
1.2 国内外相关研究的现状与分析 | 第8-12页 |
1.2.1 语音识别技术的发展及其特点 | 第8-10页 |
1.2.2 听觉场景分析(ASA)技术研究分析 | 第10-12页 |
1.3 课题研究目的及意义 | 第12页 |
1.4 论文的主要工作及内容安排 | 第12-14页 |
第2章 基于计算听觉场景分析的语音分离技术研究与分析 | 第14-27页 |
2.1 语音信号的高阶声学表示 | 第14-16页 |
2.1.1 自相关图(Autocorrelation map) | 第14-15页 |
2.1.2 互相关图(correlogram) | 第15页 |
2.1.3 频率转移轨迹 | 第15页 |
2.1.4 开始和结束映射 | 第15-16页 |
2.2 听觉元素分离 | 第16-21页 |
2.2.1 听觉元素的形成 | 第17页 |
2.2.2 听觉元素的组合方式 | 第17-18页 |
2.2.3 元素的分离策略 | 第18-20页 |
2.2.4 通过使用相同的开始和结束时间进行分离 | 第20-21页 |
2.3 听觉元素的搜索与重组 | 第21-22页 |
2.3.1 搜索策略 | 第21-22页 |
2.3.2 听觉元素的重组 | 第22页 |
2.4 实验结果分析 | 第22-26页 |
2.5 本章小结 | 第26-27页 |
第3章 基于 HTK 的语音识别系统设计 | 第27-43页 |
3.1 隐马尔可夫模型(HMM)在语音识别领域的应用 | 第27-29页 |
3.2 MFCC 特征参数提取 | 第29-30页 |
3.3 基于 HTK 的语音识别系统搭建 | 第30-41页 |
3.3.1 数据准备 | 第31-35页 |
3.3.2 模型训练 | 第35-38页 |
3.3.3 建立捆绑状态三音素模型 | 第38-40页 |
3.3.4 识别方法与性能评估 | 第40-41页 |
3.4 本章小结 | 第41-43页 |
第4章 语音预处理系统在移动环境下的实现 | 第43-52页 |
4.1 ANDROID 客户端程序设计与开发 | 第44-48页 |
4.1.1 客户端界面设计 | 第44-45页 |
4.1.2 客户端各个功能模块实现 | 第45-48页 |
4.2 服务器端功能的实现 | 第48-49页 |
4.2.1 将原始语音文件转换为与语音分割程序相兼容的声音文件 | 第48-49页 |
4.2.2 服务器端调用语音分离和语音识别程序 | 第49页 |
4.3 实验结果分析 | 第49-51页 |
4.4 本章小结 | 第51-52页 |
结论 | 第52-54页 |
参考文献 | 第54-58页 |
致谢 | 第58页 |