首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

藏语连续语音识别技术研究及系统实现

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第12-17页
    1.1 语音识别概述第12-13页
    1.2 语音识别技术的发展第13-15页
        1.2.1 国外语音识别发展第13-14页
        1.2.2 国内语音识别发展第14-15页
    1.3 藏语语音识别研究现状第15页
    1.4 本文主要内容及结构第15-17页
第二章 语音识别基本原理第17-30页
    2.1 语音信号预处理第18页
    2.2 语音信号的特征提取第18-22页
        2.2.1 语音信号预加重第19页
        2.2.2 加窗分帧处理第19页
        2.2.3 语音的端点检测第19-20页
        2.2.4 梅尔频率倒谱系数(MFCC)第20-22页
    2.3 声学模型第22-29页
        2.3.1 隐马尔科夫模型(HMM)第22-25页
        2.3.2 HMM模型的三个问题第25页
        2.3.3 HMM三个基本算法第25-29页
    2.4 语言模型第29页
    2.5 本章小结第29-30页
第三章 基于HTK的藏语连续语音识别声学模型建模第30-42页
    3.1 HTK工具介绍第30页
    3.2 语音库的建立第30-31页
    3.3 建模单元的选择第31-32页
    3.4 HMM声学模型建模第32-40页
        3.4.1 数据准备第32-35页
        3.4.2 monophones模型训练第35-37页
        3.4.3 triphones模型训练第37-38页
        3.4.4 种子模型第38-39页
        3.4.5 识别测试第39-40页
    3.5 识别结果与分析第40-41页
    3.6 本章小结第41-42页
第四章 基于sparse auto-encoder的英藏跨语言语音识别研究方法第42-52页
    4.1 引言第42-43页
    4.2 英语和藏语的AF-to-Phone映射第43-46页
    4.3 跨语言音素识别框架第46页
    4.4 sparse auto-encoder算法第46-48页
    4.5 实验与结果分析第48-50页
    4.6 本章小结第50-52页
第五章 藏语拉萨话连续语音识别系统的实现第52-56页
    5.1 语音识别系统架构第52-53页
    5.2 藏语拉萨话语音识别系统实现第53-55页
    5.3 本章小结第55-56页
第六章 总结与展望第56-58页
    6.1 总结第56页
    6.2 展望第56-58页
参考文献第58-62页
致谢第62-63页
攻读硕士期间发表的学术论文目录第63页

论文共63页,点击 下载论文
上一篇:基于软件无线电技术的雷达通信网络应用研究
下一篇:基于电磁超材料覆层的2.45GHz高指向性微带天线设计