首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

长音频与文本的对齐研究

摘要第1-7页
Abstract第7-9页
第一章 引言第9-13页
 §1.1 研究背景第9页
 §1.2 语音与文本匹配技术的研究现状和难点第9-11页
 §1.3 主要研究内容和组织结构第11-13页
第二章 传统的语音文本对齐算法第13-18页
 §2.1 隐马尔可夫模型 HMM第13-15页
 §2.2 维特比对齐算法第15-18页
第三章 自适应长音频文本对齐算法第18-35页
 §3.1 中文音频识别过程第18-29页
  §3.1.1 参考文本预处理第18-21页
  §3.1.2 端点检测技术第21-22页
  §3.1.3 特征提取第22-25页
  §3.1.4 声学模型和声学模型自适应第25-27页
  §3.1.5 语言模型和语言模型自适应第27-29页
 §3.2 识别文本与参考文本的对齐过程第29-31页
  §3.2.1 编辑距离 Edit Distance第29-31页
 §3.3 迭代过程第31页
 §3.4 自适应语音文本对齐算法第31-34页
 §3.5 具体实施第34-35页
第四章 实验结果和分析第35-49页
 §4.1 实验基本设置第35-39页
  §4.1.1 语音识别引擎 HTK 和相关命令参数配置第35-37页
  §4.1.2 Srilm 语言模型工具第37-38页
  §4.1.3 文本与文本对齐工具 SCTK 之Sclite第38-39页
 §4.2 实验结果第39-47页
 §4.3 实验结果分析第47-49页
第五章 总结与展望第49-50页
 §5.1 全文总结第49页
 §5.2 工作展望第49-50页
参考文献第50-54页
致谢第54-55页
附录第55-59页

论文共59页,点击 下载论文
上一篇:基于局部血管结构的眼底图像配准
下一篇:归档网络信息价值的元数据描述