首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

深度视音频双模态语音识别方法

摘要第5-7页
abstract第7-8页
第1章 绪言第11-21页
    1.1 研究背景与意义第11-13页
    1.2 研究现状第13-17页
        1.2.1 基于特征层面第13-15页
        1.2.2 基于融合&识别层面第15-17页
    1.3 现有方法普遍问题第17-18页
    1.4 论文创新点第18-19页
        1.4.1 深度时态框架模型的创新点第18-19页
        1.4.2 多模态辅助损失门控循环网络模型第19页
    1.5 论文组织架构第19-21页
第2章 深度时态框架模型第21-35页
    2.1 多模态深度自编码网络和长短时记忆网络第21-23页
        2.1.1 多模态深度自编码网络第21-22页
        2.1.2 长短时记忆网络第22-23页
    2.2 提出的深度时态框架模型第23-27页
        2.2.1 模态融合第23-24页
        2.2.2 含有时态因素的模态融合第24-26页
        2.2.3 时态融合第26-27页
        2.2.4 识别网络第27页
        2.2.5 训练策略第27页
    2.3 实验第27-33页
        2.3.1 数据库第28-29页
        2.3.2 实验设置第29-31页
        2.3.3 结果分析第31-33页
    2.4 本章小结第33-35页
第3章 多模态辅助损失门控循环网络模型第35-53页
    3.1 特征提取第35-37页
        3.1.1 视频特征提取第36页
        3.1.2 音频特征提取第36-37页
    3.2 数据增强第37-38页
        3.2.1 视觉数据增强第37页
        3.2.2 听觉数据增强第37-38页
        3.2.3 生成数据增强第38页
    3.3 融合&识别第38-42页
        3.3.1 门控循环网络第39-40页
        3.3.2 多模态辅助损失门控循环网络第40-42页
    3.4 实验第42-51页
        3.4.1 数据库第43-44页
        3.4.2 实验设置第44-46页
        3.4.3 结果分析第46-51页
    3.5 本章小结第51-53页
第4章 总结与展望第53-55页
参考文献第55-63页
致谢第63-65页
作者简历及攻读学位期间发表的学术论文与研究成果第65页

论文共65页,点击 下载论文
上一篇:基于sCMOS的低噪声成像系统设计
下一篇:空间激光通信收发同轴角锥标校技术研究