首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

端到端自动语音识别技术研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第11-19页
    1.1 课题背景第11-12页
    1.2 国内外研究现状第12-15页
    1.3 研究意义第15-16页
    1.4 本文研究内容第16-17页
    1.5 论文结构第17-19页
第二章 传统语音识别框架第19-27页
    2.1 语音识别基本原理第19-20页
    2.2 语音信号特征提取第20-22页
        2.2.1 线性预测编码(LPC)第21页
        2.2.2 mel倒谱系数(MFCC)第21-22页
    2.3 声学模型第22-23页
    2.4 语言模型第23页
    2.5 解码第23-24页
    2.6 语音识别评判标准第24页
    2.7 本章小结第24-27页
第三章 基于联合CTC与ATTENTION机制的端到端模型第27-43页
    3.1 端到端自动语音识别第27页
    3.2 基于CTC的端到端模型第27-30页
        3.2.1 CTC声学模型第28页
        3.2.2 CTC字母模型第28-29页
        3.2.3 CTC 目标函数第29-30页
    3.3 基于ATTENTION机制的端到端模型第30-33页
        3.3.1 编码网络第30页
        3.3.2 注意力机制第30-31页
        3.3.3 解码网络第31-33页
    3.4 联合CTC与ATTENTION机制的端到端模型第33-40页
        3.4.1 编码网络第34-35页
        3.4.2 解码网络第35-40页
    3.5 实验及实验结果分析第40-41页
        3.5.1 数据集第40页
        3.5.2 实验参数第40页
        3.5.3 实验结果及分析第40-41页
    3.6 本章小结第41-43页
第四章 基于循环神经网络自适应映射的端到端模型第43-53页
    4.1 模型结构第43-44页
    4.2 对数似然损失第44-45页
    4.3 类前向-后向算法第45-47页
    4.4 期望损失第47-48页
    4.5 实验及实验结果分析第48-51页
        4.5.1 数据集第48页
        4.5.2 实验参数第48页
        4.5.3 实验结果及分析第48-51页
    4.6 本章小结第51-53页
第五章 针对普通话的RAM端到端模型改进第53-61页
    5.1 普通话语音识别模型改进第53-56页
        5.1.1 编码网络第54-55页
        5.1.2 解码网络第55-56页
    5.2 跨语言迁移学习第56-58页
        5.2.1 第0阶段—英文数据集预训练第57-58页
        5.2.2 第1阶段—解码网络重训练第58页
        5.2.3 第2阶段—微调编码网络和解码网络第58页
    5.3 实验及实验结果分析第58-60页
        5.3.1 数据集第58-59页
        5.3.2 实验参数第59页
        5.3.3 实验结果及分析第59-60页
    5.4 本章小结第60-61页
第六章 总结与展望第61-63页
    6.1 课题总结第61页
    6.2 未来展望第61-63页
参考文献第63-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:基于微服务架构的双语阅读平台的设计与实现
下一篇:我国高校师范类专业认证政策研究