摘要 | 第1-5页 |
Abstract | 第5-11页 |
主要符号对照表 | 第11-12页 |
第1章 绪论 | 第12-34页 |
·语音检索的背景与问题定义 | 第12-14页 |
·语音检索的技术路线与关键问题 | 第14-16页 |
·语音检索的基本技术路线 | 第14页 |
·语音检索的关键问题 | 第14-16页 |
·语音检索的技术概述 | 第16-29页 |
·语音识别的研究与发展 | 第16-18页 |
·语音检索的研究与发展 | 第18-24页 |
·语音识别与检索的评价准则 | 第24-28页 |
·汉语语音检索中的特殊问题 | 第28-29页 |
·系统框架与研究内容概述 | 第29-34页 |
·论文所采用的语音检索系统框架 | 第29页 |
·论文实验用数据及评价准则 | 第29-32页 |
·论文主要贡献 | 第32页 |
·论文章节安排 | 第32-34页 |
第2章 有穷自动机及相关算法 | 第34-55页 |
·引论 | 第34页 |
·从有穷自动机到加权有限状态转换器 | 第34-42页 |
·正则语言与正则表达式 | 第34-36页 |
·有穷自动机(Finite-state Automation: FA) | 第36-37页 |
·有限状态转换器(Finite-state Transducer: FST) | 第37-38页 |
·半环与加权有限状态转换器 | 第38-41页 |
·FA、FST 与 WFST 形式上的统一 | 第41-42页 |
·有穷自动机与加权有限状态转换器的相关算法 | 第42-54页 |
·合成(Composition)算法 | 第42-46页 |
·关联(Connection)算法 | 第46页 |
·确定化(Determinization)算法 | 第46-50页 |
·权重规整(Weightpushing)算法 | 第50-51页 |
·最小化(Minimization) | 第51-53页 |
·转移消除(ε-removal)算法 | 第53-54页 |
·小结 | 第54-55页 |
第3章 静态解码网络构建基础 | 第55-73页 |
·引论 | 第55页 |
·大词汇量连续语音识别(LVCSR)系统 | 第55-57页 |
·语音识别的基本模型 | 第55页 |
·语音的产生与隐马尔可夫模型 | 第55-56页 |
·跨词三音子模型与词典 | 第56-57页 |
·N 元语言模型 | 第57页 |
·语音识别的搜索空间与静态解码网络 | 第57-60页 |
·语音识别搜索空间 | 第57-58页 |
·静态搜索空间与基于 WFST 的语音识别 | 第58-60页 |
·识别模型的加权有限状态转换器表示 | 第60-69页 |
·N 元语言模型的 WFST 表示 | 第60-63页 |
·词典的 WFST 表示 | 第63-66页 |
·跨词三音子模型的 WFST 表示 | 第66-68页 |
·隐马尔可夫模型的 WFST 表示 | 第68-69页 |
·语音识别静态解码网络的构建 | 第69-70页 |
·静态解码网络有待解决的问题 | 第70-71页 |
·静态网络的构建过程中空间复杂度较高 | 第70页 |
·构建后的网络体积相对较大 | 第70-71页 |
·识别结果中每个词的精确时间不易确定 | 第71页 |
·小结 | 第71-73页 |
第4章 静态解码网络构建改进 | 第73-113页 |
·引论 | 第73页 |
·同步剪枝合成算法 | 第73-86页 |
·经典合成算法 | 第73-74页 |
·经典合成算法的不足 | 第74-76页 |
·同步剪枝合成算法 | 第76-79页 |
·算法正确性分析 | 第79-80页 |
·算法的复杂度分析 | 第80-82页 |
·SPCA 实验结果 | 第82-85页 |
·小结 | 第85-86页 |
·状态转移数准则与ε-Removal 算法的改进 | 第86-98页 |
·ε状态转移的产生与影响 | 第86页 |
·经典的ε-Removal 算法 | 第86-88页 |
·经典ε-Removal 算法与状态转移数的变化分析 | 第88页 |
·基于 WFST 反转的ε-Removal 与语音识别静态解码网络 | 第88-90页 |
·转移扩充状态与状态转移数准则 | 第90-94页 |
·算法时间与空间复杂度说明 | 第94页 |
·ε-Removal 实验结果 | 第94-97页 |
·小结 | 第97-98页 |
·基于词典错位的网络构建 | 第98-112页 |
·问题的产生 | 第98-99页 |
·解决方案的分析 | 第99-100页 |
·引入词间停顿的静态解码网络的构建 | 第100-105页 |
·基于词典错位的网络构建 | 第105-110页 |
·静态解码网络复杂度的对比分析 | 第110-111页 |
·方案的正确性验证 | 第111-112页 |
·小结 | 第112-113页 |
第5章 面向检索的语音识别 | 第113-126页 |
·引论 | 第113页 |
·基于词格的快速词图生成算法(TBLG)[81][82] | 第113-122页 |
·多候选的识别结果:从 N-Best 到词图(Lattice) | 第113-114页 |
·两遍(Two-Pass)识别算法 | 第114-115页 |
·Tree-Trellis Search 算法的回顾 | 第115-117页 |
·TBLG 算法[81][82] | 第117-122页 |
·识别试验 | 第122-125页 |
·对比系统 | 第122-123页 |
·识别结果与分析 | 第123-125页 |
·小结 | 第125-126页 |
第6章 语音检索算法的研究 | 第126-162页 |
·引论 | 第126页 |
·针对语音检索的索引建立 | 第126-131页 |
·识别结果的预处理 | 第126-129页 |
·倒排索引的建立 | 第129-130页 |
·索引建立相关实验 | 第130-131页 |
·基于词的语音检索 | 第131-140页 |
·检索的集外词问题以及现有的解决方案 | 第131-132页 |
·查询内容扩展的语音检索 | 第132-136页 |
·实验 | 第136-139页 |
·小结 | 第139-140页 |
·基于音节的语音检索 | 第140-145页 |
·系统构成 | 第140-142页 |
·检索结果 | 第142-144页 |
·小结 | 第144-145页 |
·基于系统融合的语音检索 | 第145-149页 |
·前向融合与后向融合 | 第145-147页 |
·融合实验与结果分析 | 第147-149页 |
·其它融合方式的讨论 | 第149页 |
·小结 | 第149页 |
·分组检索与检索速度的提升 | 第149-160页 |
·查询集合半环 | 第150页 |
·搜索空间的有限状态转换器表示 | 第150-152页 |
·检索词的分组与有限状态转换器的优化 | 第152-153页 |
·有限状态转换器上基于令牌的检索算法 | 第153-155页 |
·实验与分析 | 第155-160页 |
·小结 | 第160页 |
·小结 | 第160-162页 |
第7章 总结与展望 | 第162-166页 |
·工作总结 | 第162-163页 |
·创新点 | 第163-164页 |
·问题分析与展望 | 第164-166页 |
参考文献 | 第166-171页 |
致谢 | 第171-173页 |
个人简历、在学期间发表的学术论文与研究成果 | 第173页 |