首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于MPE藏语拉萨话区分度声学模型研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-15页
    1.1 引言第10-11页
    1.2 研究背景第11页
    1.3 研究内容及意义第11-12页
    1.4 国内外研究现状第12-14页
        1.4.1 语音识别发展、现状第12-13页
        1.4.2 区分性训练发展和现状第13-14页
    1.5 论文章节概要第14-15页
第2章 语音识别的基本理论第15-23页
    2.1 引言第15页
    2.2 语音识别系统的整体框架第15-20页
        2.2.1 特征参数提取第16-18页
            MFCC第16-17页
            PLP第17-18页
        2.2.2 声学模型第18页
        2.2.3 语言模型第18-19页
        2.2.4 解码器第19-20页
    2.3 语音识别系统的分类第20-21页
    2.4 语音识别的主要方法第21-22页
        动态时间规整(DTW)第21页
        隐马尔可夫模型(HMM)第21-22页
        人工神经网络(ANN)第22页
    2.5 本章小结第22-23页
第3章 藏语拉萨话声学模型研究第23-36页
    3.1 基于HMM的声学模型第23-31页
        3.1.1 HMM第23-26页
            评估问题:第25页
            解码问题:第25-26页
            训练问题:第26页
        3.1.2 似然值计算第26-28页
        3.1.3 HMM解码问题第28-29页
        3.1.4 上下文相关问题第29-31页
    3.2 构建三音子模型第31-35页
        3.2.1 藏语连续语音识别中的建模单元第32-33页
        3.2.2 决策树状态聚类第33-35页
    3.3 本章小结第35-36页
第4章 基于MPE的声学模型训练第36-50页
    4.1 引言第36-37页
    4.2 区分性训练方法第37-38页
        4.2.1 最大互信息估计准则第37-38页
        4.2.2 最小音素错误准则(MPE)第38页
    4.3 MPE目标函数的定义第38-39页
    4.4 音素正确率的估算第39-40页
    4.5 最大化目标函数第40-44页
    4.6 模型的参数更新第44-48页
    4.7 基于MPE声学模型训练流程第48-49页
    4.8 本章小结第49-50页
第5章 实验分析及结果第50-61页
    5.1 数据准备第50-52页
        5.1.1 HTK工具箱第50-51页
        5.1.2 语料库的建设第51页
        5.1.3 藏语拉萨话发音字典的建立第51-52页
    5.2 藏语音素辨识系统性能评价指标第52-53页
    5.3 实验结果与分析第53-60页
        5.3.1 实验1:建模单元的选取第53-54页
        5.3.2 实验2:高斯混合数的设定第54-56页
        5.3.3 实验3:惩罚因子的设定第56-57页
        5.3.4 实验4:Phone lattice大小的设定第57-58页
        5.3.5 实验5:加入Ⅰ—平滑函数第58-60页
    5.4 本章小结第60-61页
第6章 总结和展望第61-63页
    6.1 全文总结第61页
    6.2 展望第61-63页
参考文献第63-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:初中藏语数学教师有效课堂提问研究--基于教学比赛录像和学校课堂教学的分析
下一篇:敦煌舞传播探究