长音频与文本的对齐研究

摘要	第1-7页
Abstract	第7-9页
第一章引言	第9-13页
§1.1 研究背景	第9页
§1.2 语音与文本匹配技术的研究现状和难点	第9-11页
§1.3 主要研究内容和组织结构	第11-13页
第二章传统的语音文本对齐算法	第13-18页
§2.1 隐马尔可夫模型 HMM	第13-15页
§2.2 维特比对齐算法	第15-18页
第三章自适应长音频文本对齐算法	第18-35页
§3.1 中文音频识别过程	第18-29页
§3.1.1 参考文本预处理	第18-21页
§3.1.2 端点检测技术	第21-22页
§3.1.3 特征提取	第22-25页
§3.1.4 声学模型和声学模型自适应	第25-27页
§3.1.5 语言模型和语言模型自适应	第27-29页
§3.2 识别文本与参考文本的对齐过程	第29-31页
§3.2.1 编辑距离 Edit Distance	第29-31页
§3.3 迭代过程	第31页
§3.4 自适应语音文本对齐算法	第31-34页
§3.5 具体实施	第34-35页
第四章实验结果和分析	第35-49页
§4.1 实验基本设置	第35-39页
§4.1.1 语音识别引擎 HTK 和相关命令参数配置	第35-37页
§4.1.2 Srilm 语言模型工具	第37-38页
§4.1.3 文本与文本对齐工具 SCTK 之Sclite	第38-39页
§4.2 实验结果	第39-47页
§4.3 实验结果分析	第47-49页
第五章总结与展望	第49-50页
§5.1 全文总结	第49页
§5.2 工作展望	第49-50页
参考文献	第50-54页
致谢	第54-55页
附录	第55-59页