首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于内容的汉语语音检索技术研究与系统实现

摘要第1-5页
Abstract第5-11页
主要符号对照表第11-12页
第1章 绪论第12-34页
   ·语音检索的背景与问题定义第12-14页
   ·语音检索的技术路线与关键问题第14-16页
     ·语音检索的基本技术路线第14页
     ·语音检索的关键问题第14-16页
   ·语音检索的技术概述第16-29页
     ·语音识别的研究与发展第16-18页
     ·语音检索的研究与发展第18-24页
     ·语音识别与检索的评价准则第24-28页
     ·汉语语音检索中的特殊问题第28-29页
   ·系统框架与研究内容概述第29-34页
     ·论文所采用的语音检索系统框架第29页
     ·论文实验用数据及评价准则第29-32页
     ·论文主要贡献第32页
     ·论文章节安排第32-34页
第2章 有穷自动机及相关算法第34-55页
   ·引论第34页
   ·从有穷自动机到加权有限状态转换器第34-42页
     ·正则语言与正则表达式第34-36页
     ·有穷自动机(Finite-state Automation: FA)第36-37页
     ·有限状态转换器(Finite-state Transducer: FST)第37-38页
     ·半环与加权有限状态转换器第38-41页
     ·FA、FST 与 WFST 形式上的统一第41-42页
   ·有穷自动机与加权有限状态转换器的相关算法第42-54页
     ·合成(Composition)算法第42-46页
     ·关联(Connection)算法第46页
     ·确定化(Determinization)算法第46-50页
     ·权重规整(Weightpushing)算法第50-51页
     ·最小化(Minimization)第51-53页
     ·转移消除(ε-removal)算法第53-54页
   ·小结第54-55页
第3章 静态解码网络构建基础第55-73页
   ·引论第55页
   ·大词汇量连续语音识别(LVCSR)系统第55-57页
     ·语音识别的基本模型第55页
     ·语音的产生与隐马尔可夫模型第55-56页
     ·跨词三音子模型与词典第56-57页
     ·N 元语言模型第57页
   ·语音识别的搜索空间与静态解码网络第57-60页
     ·语音识别搜索空间第57-58页
     ·静态搜索空间与基于 WFST 的语音识别第58-60页
   ·识别模型的加权有限状态转换器表示第60-69页
     ·N 元语言模型的 WFST 表示第60-63页
     ·词典的 WFST 表示第63-66页
     ·跨词三音子模型的 WFST 表示第66-68页
     ·隐马尔可夫模型的 WFST 表示第68-69页
   ·语音识别静态解码网络的构建第69-70页
   ·静态解码网络有待解决的问题第70-71页
     ·静态网络的构建过程中空间复杂度较高第70页
     ·构建后的网络体积相对较大第70-71页
     ·识别结果中每个词的精确时间不易确定第71页
   ·小结第71-73页
第4章 静态解码网络构建改进第73-113页
   ·引论第73页
   ·同步剪枝合成算法第73-86页
     ·经典合成算法第73-74页
     ·经典合成算法的不足第74-76页
     ·同步剪枝合成算法第76-79页
     ·算法正确性分析第79-80页
     ·算法的复杂度分析第80-82页
     ·SPCA 实验结果第82-85页
     ·小结第85-86页
   ·状态转移数准则与ε-Removal 算法的改进第86-98页
     ·ε状态转移的产生与影响第86页
     ·经典的ε-Removal 算法第86-88页
     ·经典ε-Removal 算法与状态转移数的变化分析第88页
     ·基于 WFST 反转的ε-Removal 与语音识别静态解码网络第88-90页
     ·转移扩充状态与状态转移数准则第90-94页
     ·算法时间与空间复杂度说明第94页
     ·ε-Removal 实验结果第94-97页
     ·小结第97-98页
   ·基于词典错位的网络构建第98-112页
     ·问题的产生第98-99页
     ·解决方案的分析第99-100页
     ·引入词间停顿的静态解码网络的构建第100-105页
     ·基于词典错位的网络构建第105-110页
     ·静态解码网络复杂度的对比分析第110-111页
     ·方案的正确性验证第111-112页
   ·小结第112-113页
第5章 面向检索的语音识别第113-126页
   ·引论第113页
   ·基于词格的快速词图生成算法(TBLG)[81][82]第113-122页
     ·多候选的识别结果:从 N-Best 到词图(Lattice)第113-114页
     ·两遍(Two-Pass)识别算法第114-115页
     ·Tree-Trellis Search 算法的回顾第115-117页
     ·TBLG 算法[81][82]第117-122页
   ·识别试验第122-125页
     ·对比系统第122-123页
     ·识别结果与分析第123-125页
   ·小结第125-126页
第6章 语音检索算法的研究第126-162页
   ·引论第126页
   ·针对语音检索的索引建立第126-131页
     ·识别结果的预处理第126-129页
     ·倒排索引的建立第129-130页
     ·索引建立相关实验第130-131页
   ·基于词的语音检索第131-140页
     ·检索的集外词问题以及现有的解决方案第131-132页
     ·查询内容扩展的语音检索第132-136页
     ·实验第136-139页
     ·小结第139-140页
   ·基于音节的语音检索第140-145页
     ·系统构成第140-142页
     ·检索结果第142-144页
     ·小结第144-145页
   ·基于系统融合的语音检索第145-149页
     ·前向融合与后向融合第145-147页
     ·融合实验与结果分析第147-149页
     ·其它融合方式的讨论第149页
     ·小结第149页
   ·分组检索与检索速度的提升第149-160页
     ·查询集合半环第150页
     ·搜索空间的有限状态转换器表示第150-152页
     ·检索词的分组与有限状态转换器的优化第152-153页
     ·有限状态转换器上基于令牌的检索算法第153-155页
     ·实验与分析第155-160页
     ·小结第160页
   ·小结第160-162页
第7章 总结与展望第162-166页
   ·工作总结第162-163页
   ·创新点第163-164页
   ·问题分析与展望第164-166页
参考文献第166-171页
致谢第171-173页
个人简历、在学期间发表的学术论文与研究成果第173页

论文共173页,点击 下载论文
上一篇:性能驱动的力指向布局算法研究
下一篇:基于SAR图像的目标检测研究