摘要 | 第1-5页 |
ABSTRACT | 第5-11页 |
表格索引 | 第11-12页 |
插图索引 | 第12-13页 |
主要符号对照表 | 第13-14页 |
第一章 绪论 | 第14-22页 |
·课题研究背景 | 第14-16页 |
·语音识别研究的发展历史 | 第14-16页 |
·当前的大词汇语音识别技术的研究热点 | 第16-19页 |
·课题研究内容 | 第19页 |
·本文组织结构 | 第19-22页 |
第二章 基于无关变量标准化的大词汇连续语音识别 | 第22-28页 |
·隐马尔可夫模型(Hidden Markov Model,HMM)及其最大似然估计 | 第22-24页 |
·定义 | 第22-23页 |
·Viterbi算法 | 第23-24页 |
·Baum-Welch算法 | 第24页 |
·基于无关变量标准化的大词汇连续语音识别 | 第24-25页 |
·特征的线性变换 | 第25-26页 |
·声学环境特征分类(acoustic sniffing) | 第26-27页 |
·基于滑动窗口的特征分类 | 第26-27页 |
·基于极大似然的IVN训练 | 第27页 |
·无监督在线适应 | 第27-28页 |
第三章 基于无关变量标准化的判别式训练 | 第28-42页 |
·基于说话人信息的声学环境检测(Acoustic Sniffing) | 第28-29页 |
·判别式训练 | 第29-31页 |
·最大互信息估计(MMIE)准则 | 第30-31页 |
·基于EB的模型参数优化算法 | 第31页 |
·基于无关变量标准化的判别式训练 | 第31-37页 |
·无监督自适应学习 | 第37-38页 |
·实验 | 第38-40页 |
·实验环境 | 第38页 |
·基于无关变量消除的判别式训练的效果 | 第38-39页 |
·无监督自适应学习的效果 | 第39-40页 |
·本章小结 | 第40-42页 |
第四章 基于i-vector方法的语音数据聚类 | 第42-54页 |
·i-vector方法 | 第42-45页 |
·数据模型 | 第42-43页 |
·i-vector提取 | 第43-44页 |
·超参数(hyperparameter)估计 | 第44-45页 |
·基于i-vector的数据聚类 | 第45-47页 |
·利用LBG算法对i-vector进行聚类 | 第45页 |
·训练多组声学模型 | 第45-46页 |
·利用多组声学模型于语音识别 | 第46-47页 |
·实验 | 第47-49页 |
·实验环境 | 第47-48页 |
·实验结果 | 第48-49页 |
·本章小结 | 第49-54页 |
第五章 基于i-vector方法的无关变量标准化训练 | 第54-58页 |
·基于i-vector方法的声学环境检测 | 第54-55页 |
·实验 | 第55-57页 |
·实验环境 | 第55页 |
·基于i-Vector与GMM方法的声学环境特征检测的对比 | 第55页 |
·增加线性变换数目的效果 | 第55-56页 |
·选取不同长度语音片段的效果 | 第56-57页 |
·本章小结 | 第57-58页 |
第六章 新的i-vector提取方法 | 第58-70页 |
·新的i-Vector方法 | 第58-65页 |
·数据模型 | 第58页 |
·i-Vector提取 | 第58-60页 |
·超参数(hyperparameter)估计 | 第60-64页 |
·利用线性判别分析提取特征(Linear Discriminative Anal-ysis,LDA) | 第64-65页 |
·基于i-vector的声学环境特征检测 | 第65页 |
·实验 | 第65-68页 |
·实验环境 | 第65页 |
·对比新旧i-vector方法的说话人聚类纯度 | 第65-67页 |
·对比不同i-vector方法应用于无关变量标准化训练的识别结果 | 第67-68页 |
·本章小结 | 第68-70页 |
全文总结 | 第70-72页 |
参考文献 | 第72-80页 |
致谢 | 第80-82页 |
攻读学位期间发表的学术论文目录 | 第82-86页 |
附件 | 第86页 |