首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

非母语说话人发音空间建模方法的研究

摘要第2-3页
ABSTRACT第3-4页
第1章 绪论第7-18页
    1.1 研究的背景和意义第7-8页
    1.2 非母语说话人语音识别的研究现状第8-11页
        1.2.1 声学模型自适应第9-10页
        1.2.2 发音字典自适应第10-11页
    1.3 研究的理论依据及所要突破的难题第11-16页
        1.3.1 研究的理论依据第11-14页
        1.3.2 研究中所要突破的难题第14-16页
    1.4 研究的方法以及创新点第16-17页
    1.5 论文的结构安排第17-18页
第2章 基于标准发音字典的语音识别第18-29页
    2.1 引言第18页
    2.2 使用标准普通话进行声学建模第18-24页
        2.2.1 汉语识别基元的选择第18-20页
        2.2.2 上下文相关模型中的状态共享第20-23页
        2.2.3 高斯混合分裂(mixture splitting)第23-24页
    2.3 标准普通话模型的识别结果第24-26页
    2.4 使用标准模型存在的问题第26-28页
    2.5 本章小结第28-29页
第3章 多发音字典的构造方法第29-37页
    3.1 引言第29-30页
    3.2 基于音素的多发音字典第30-35页
        3.2.1 基于人工总结获取音素的发音映射第31-32页
        3.2.2 基于数据驱动的方法获取音素的发音映射第32-35页
    3.3 基于音节的多发音字典构造方法第35页
    3.4 发音字典的剪枝策略第35-36页
        3.4.1 剪枝策略的选取第35-36页
    3.5 剪枝以后的音素和音节映射进行规则发音字典的扩展第36页
    3.6 本章小结第36-37页
第4章 多发音字典构造识别器第37-41页
    4.1 引言第37页
    4.2 多发音字典和标准声学模型结合第37-39页
    4.3 本章小结第39-41页
第5章 实验结果与分析第41-56页
    5.1 引言第41-42页
    5.2 标准普通话识别器第42-45页
        5.2.1 主元音和声韵母建模用于标准普通话说话人的识别结果对比第42-45页
    5.3 使用多发音字典构造识别器第45-56页
        5.3.1 基于人工总结的方法获取多发音字典第45-46页
        5.3.2 基于数据驱动的方法获取多发音字典第46-56页
第6章 总结和展望第56-59页
    6.1 总结第56页
    6.2 展望第56-59页
参考文献第59-63页
作者在攻读硕士学位期间发表的论文第63-64页
致谢第64-65页

论文共65页,点击 下载论文
上一篇:基于FPGA的图像信息识别的研究
下一篇:基于测距的无线传感器网络克隆节点判别算法研究