摘要 | 第1-4页 |
Abstract | 第4-8页 |
第1章 引言 | 第8-12页 |
·语音识别的背景及意义 | 第8页 |
·语音识别的历史与现状 | 第8-10页 |
·选题背景和研究意义 | 第10-11页 |
·论文章节安排 | 第11-12页 |
第2章 加权有限状态机理论和有限状态图 | 第12-23页 |
·本章引论 | 第12页 |
·加权有限状态接收器(WFSA)和加权有限状态转换器(WFST)的定义 | 第12-15页 |
·加权有限状态机相关操作 | 第15-21页 |
·组合操作(composition) | 第15-17页 |
·确定化操作(determinization) | 第17-19页 |
·最小化操作(minimization) | 第19-21页 |
·有限状态图(FSG)的定义 | 第21页 |
·FSG 和 WFST 的相互转换 | 第21-23页 |
第3章 语音识别系统概述 | 第23-30页 |
·语音识别系统框架 | 第23-26页 |
·声学模型 | 第24-25页 |
·语言模型 | 第25-26页 |
·词图 | 第26-27页 |
·语音识别中的基本参数说明 | 第27-28页 |
·实时因子(RTF) | 第27页 |
·单词错误率(WER)、音节错误率(CER)和词图错误率(GER) | 第27-28页 |
·词图密度(WGD) | 第28页 |
·加权有限状态转换器在语音识别中的应用 | 第28-30页 |
第4章 中英文大词汇量连续语音识别系统的设计 | 第30-47页 |
·本章引论 | 第30-31页 |
·知识源的 WFST 表示、组合及优化 | 第31-40页 |
·语言模型(G)的表示 | 第31-33页 |
·发音词典(L)的表示 | 第33-34页 |
·上下文相关音子模型(C)的表示 | 第34-38页 |
·声学模型(H)的表示 | 第38-39页 |
·搜索网络的构建及优化 | 第39-40页 |
·用于词图生成的搜索网络的构建及相关操作 | 第40-46页 |
·用于词图生成的搜索网络的构建 | 第40-42页 |
·PushLabel 操作 | 第42-46页 |
·GrpDecoder 简介 | 第46-47页 |
第5章 性能测试 | 第47-61页 |
·本章引论 | 第47页 |
·FSG 相对于 WFST 的优势 | 第47-48页 |
·英文实验 | 第48-53页 |
·英文实验设置 | 第48-49页 |
·英文搜索网络的构建及规模 | 第49页 |
·英文 1-best 实验结果 | 第49-50页 |
·英文 lattice 实验结果 | 第50-53页 |
·中文 1-best 实验 | 第53-61页 |
·中文实验设置 | 第53-54页 |
·中文搜索网络的构建及规模 | 第54-55页 |
·中文 1-best 实验结果 | 第55-56页 |
·中文 lattice 实验结果 | 第56-61页 |
第6章 总结与展望 | 第61-62页 |
参考文献 | 第62-64页 |
致谢 | 第64-65页 |
个人简历、在学期间发表的学术论文与研究成果 | 第65页 |