首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于注意力机制的端到端语音识别技术研究

摘要第4-5页
Abstract第5-6页
第一章 绪论第11-19页
    1.1 研究背景和意义第11-12页
    1.2 连续语音识别系统简介第12-15页
        1.2.1 基于隐马可夫模型的连续语音识别系统第12-14页
        1.2.2 端到端的连续语音识别系统第14-15页
    1.3 端到端语音系统的发展和研究现状第15-17页
        1.3.1 基于CTC的语音识别系统第15-16页
        1.3.2 基于注意力模型的语音识别系统第16-17页
    1.4 研究内容和结构安排第17-19页
第二章 端到端的语音识别系统第19-36页
    2.1 循环神经网络第19-22页
        2.1.1 循环神经网络单元基本结构第19-20页
        2.1.2 长短时记忆单元第20-21页
        2.1.3 门循环单元第21-22页
    2.2 基于注意力模型的语音识别系统第22-26页
        2.2.1 注意力模型框架第22-25页
        2.2.2 注意力模型训练第25页
        2.2.3 注意力模型解码第25-26页
    2.3 基于CTC的语音识别系统第26-32页
        2.3.1 基于CTC系统模型框架第26-27页
        2.3.2 CTC算法第27-29页
        2.3.3 基于CTC系统的训练第29-30页
        2.3.4 基于CTC系统的解码第30-32页
    2.4 实验系统第32-35页
        2.4.1 实验数据第32-33页
        2.4.2 实验配置第33-34页
        2.4.3 系统识别性能分析第34-35页
    2.5 本章小结第35-36页
第三章 采用最少门单元的改进注意力模型第36-45页
    3.1 最少门单元网络第36-37页
    3.2 改进的注意力机制第37-40页
        3.2.1 基于窗函数的注意力区域限定策略第37-39页
        3.2.2 自适应宽度的窗函数调整第39页
        3.2.3 基于卷积神经网络的系数特征第39-40页
        3.2.4 卷积神经网络加入池化层第40页
    3.3 实验结果及分析第40-44页
        3.3.1 实验配置第40页
        3.3.2 实验结果第40-44页
    3.4 本章小结第44-45页
第四章 基于瓶颈特征提取网络的注意力模型第45-62页
    4.1 基于DBN的瓶颈特征提取网络第45-53页
        4.1.1 基于RBM的无监督预训练第46-49页
        4.1.2 基于BP的有监督训练第49-53页
    4.2 结合瓶颈特征的注意力模型第53-54页
    4.3 基于CTC的瓶颈特征提取网络第54-56页
    4.4 实验结果及分析第56-61页
        4.4.1 实验配置第57页
        4.4.2 实验结果第57-61页
    4.5 本章小结第61-62页
第五章 总结第62-64页
    5.1 论文工作总结第62页
    5.2 前景与展望第62-64页
致谢第64-65页
参考文献第65-70页
作者简历第70页

论文共70页,点击 下载论文
上一篇:基于阵列数据域的直接定位技术研究
下一篇:基于SP馈电网络的宽带圆极化微带阵列天线