首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

子空间高斯混合模型在中文语音识别系统中的实现

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-11页
1 序论第11-14页
2 语音识别概述第14-22页
   ·语音识别系统整体框架第15-20页
     ·声学前端第16-17页
     ·经典隐马尔可夫声学模型第17-19页
     ·声学解码第19-20页
   ·隐马尔可夫模型的局限性及改进第20-21页
   ·本章小结第21-22页
3 子空间高斯混合模型第22-31页
   ·基本原理第22-24页
     ·基本模型第22页
     ·模型扩展第22-24页
       ·子状态扩展第23页
       ·发音人相关扩展第23-24页
     ·通用背景模型(UBM)第24页
   ·训练步骤第24-30页
     ·初始化第25-27页
       ·UBM的初始化与训练第25-26页
       ·特征参数变换第26页
       ·子空间模型初始化第26-27页
     ·概率计算第27-28页
       ·全局优先计算第27页
       ·高斯概率计算第27-28页
     ·模型累积量第28-29页
     ·模型完整训练第29-30页
   ·本章小结第30-31页
4 Kaldi语音识别系统第31-35页
   ·系统框架第31-32页
   ·环境搭建第32-34页
     ·运行环境第32-33页
     ·外部库第33-34页
       ·OpenFst第33页
       ·LAPACK第33-34页
   ·系统的安装与运行第34页
   ·本章小结第34-35页
5 中文子空间高斯混合模型语音识别系统第35-56页
   ·汉语普通话发音特点第35-37页
     ·声母第35-36页
     ·韵母第36-37页
     ·声调第37页
   ·汉语发音表第37-38页
   ·语音库第38-40页
     ·音频数据第38-39页
     ·文本标注第39-40页
   ·Kaldi数据准备第40-47页
     ·语音数据第40-43页
       ·语音标注文件第40-41页
       ·发音人标识文件第41页
       ·语音文件路径第41-42页
       ·分段信息文件第42页
       ·其他生成文件第42-43页
     ·语言数据第43-47页
       ·文件内容第44-46页
       ·构建方式第46-47页
   ·语言模型第47-48页
   ·模型训练第48-49页
     ·上下文相关的三音子隐马尔可夫模型第48-49页
     ·数据驱动线性特征转换第49页
   ·训练及解码脚本第49-53页
   ·实验结果第53-54页
   ·结果分析第54-55页
   ·本章小结第55-56页
6 总结与展望第56-57页
参考文献第57-60页
附录A第60-63页
附录B第63-66页
附录C第66-69页
作者简历第69-71页
学位论文数据集第71页

论文共71页,点击 下载论文
上一篇:面向用户的流媒体迁移系统设计与实现
下一篇:采用叠加导频和OFDM技术的中继网络的PAPR分析