集外词的语音检索方法研究
摘要 | 第1-6页 |
Abstract | 第6-11页 |
插图索引 | 第11-12页 |
表格索引 | 第12-13页 |
第1章 绪论 | 第13-23页 |
·集外词检索的研究背景 | 第13-14页 |
·集外词检索的研究现状 | 第14-16页 |
·集外词检索系统框架 | 第16-17页 |
·任务描述与性能评价指标 | 第17-18页 |
·任务描述 | 第17页 |
·语音识别评价指标 | 第17页 |
·语音检索评价指标 | 第17-18页 |
·论文的研究内容及实验用到的数据库 | 第18-20页 |
·研究内容 | 第18-19页 |
·数据库介绍 | 第19-20页 |
·论文的结构安排 | 第20-23页 |
第2章 基于子词的大规模连续语音识别 | 第23-43页 |
·语音识别的基本原理 | 第23-24页 |
·声学模型 | 第24-36页 |
·声学建模中的基本方法 | 第25-31页 |
·基于HMMs的声学模型 | 第25-26页 |
·状态绑定 | 第26-27页 |
·基于最大似然估计与区分性训练的声学模型 | 第27-29页 |
·基于深度神经网络的声学模型 | 第29-31页 |
·低资源条件下的声学模型优化方法 | 第31-34页 |
·音调特征提取和有调建模 | 第31-32页 |
·自动问题集生成 | 第32-33页 |
·跨语种DNN训练与ReLUs激活函数 | 第33-34页 |
·实验结果与分析 | 第34-36页 |
·英语的实验结果 | 第34页 |
·越南语的实验结果 | 第34-36页 |
·子词语言模型 | 第36-42页 |
·语言模型 | 第37页 |
·区分位置信息的音素语言模型构建 | 第37-38页 |
·词片挑选及基于词片的语言模型构建 | 第38-39页 |
·音节划分及基于音节的语言模型构建 | 第39-41页 |
·实验结果与分析 | 第41-42页 |
·本章小结 | 第42-43页 |
第3章 基于ngram索引的集外词检索 | 第43-57页 |
·ngram索引 | 第43-47页 |
·网格的定义 | 第43-44页 |
·非音素网格到音素网格转换 | 第44-46页 |
·基于网格的后验概率置信度 | 第46-47页 |
·ngram索引生成 | 第47页 |
·ngram-WFST完全匹配搜索算法 | 第47-53页 |
·自动机理论基本数学概念 | 第48-49页 |
·加权转换机合成 | 第49-50页 |
·加权转换机确定化 | 第50-51页 |
·加权转换机最小化 | 第51页 |
·ngram-WFST搜索算法实现 | 第51-53页 |
·索引FST | 第51-52页 |
·词典FST | 第52页 |
·搜索 | 第52-53页 |
·模糊匹配搜索算法 | 第53页 |
·词项相关置信度规整 | 第53-55页 |
·实验结果与分析 | 第55-56页 |
·OOV词挑选 | 第55页 |
·集外词检索性能 | 第55-56页 |
·本章小结 | 第56-57页 |
第4章 多系统融合 | 第57-65页 |
·系统融合概述 | 第57-58页 |
·基于线性逻辑回归的多系统融合 | 第58-63页 |
·逻辑回归基本性质 | 第58-59页 |
·基于共轭梯度下降的参数估计 | 第59-61页 |
·线性逻辑回归在语音检索上的应用 | 第61-63页 |
·实验结果与分析 | 第63-64页 |
·本章小结 | 第64-65页 |
第5章 总结与展望 | 第65-69页 |
·论文总结 | 第65-66页 |
·研究展望 | 第66-69页 |
参考文献 | 第69-75页 |
致谢 | 第75-77页 |
在读期间发表的学术论文与取得的其他研究成果 | 第77页 |