首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于注意力机制的多轮视频问答

摘要第5-6页
Abstract第6页
第1章 绪论第12-18页
    1.1 课题背景第12-13页
    1.2 研究难点第13-14页
    1.3 研究现状第14-15页
    1.4 研究内容第15-16页
    1.5 本文组织结构第16页
    1.6 本章小结第16-18页
第2章 相关工作第18-26页
    2.1 引言第18-19页
    2.2 图像问答第19-22页
        2.2.1 通用图像问答框架第19-20页
        2.2.2 基于残差神经网络的模型第20页
        2.2.3 基于注意力机制的模型第20-22页
        2.2.4 基于记忆神经网络的模型第22页
    2.3 视频问答第22-24页
        2.3.1 单轮视频问答第22-23页
        2.3.2 多轮问答第23-24页
    2.4 本章小结第24-26页
第3章 基于注意力机制的多轮视频问答第26-44页
    3.1 问题描述与模型分析第26-27页
    3.2 基于注意力机制的多轮视频对话算法框架第27-28页
    3.3 基于问答历史的问题理解模块第28-35页
        3.3.1 词嵌入向量第28-30页
        3.3.2 循环神经网络第30-31页
        3.3.3 注意力机制第31-33页
        3.3.4 记忆网络第33-34页
        3.3.5 本模块算法流程第34-35页
    3.4 多通道的视频表示模块第35-43页
        3.4.1 二维卷积神经网络第35-38页
        3.4.2 三维卷积神经网络第38页
        3.4.3 图像目标检测第38-41页
        3.4.4 本模块算法流程第41-43页
    3.5 答案预测模块第43页
    3.6 本章小结第43-44页
第4章 实验结果与分析第44-56页
    4.1 引言第44页
    4.2 数据集第44-45页
    4.3 基准算法第45-49页
        4.3.1 ESA第45页
        4.3.2 ESA+第45-47页
        4.3.3 STVQA+第47页
        4.3.4 STAN+第47-49页
    4.4 评价指标及实验环境第49-50页
        4.4.1 评价指标第49页
        4.4.2 实验环境第49-50页
    4.5 实验设计与结果分析第50-52页
        4.5.1 实验结果对比第50-51页
        4.5.2 模型超参分析第51页
        4.5.3 实验细节第51-52页
    4.6 本章小结第52-56页
第5章 总结与展望第56-58页
    5.1 总结第56页
    5.2 展望第56-58页
参考文献第58-62页
攻读硕士学位期间的主要研究成果第62-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:自然语言处理能力开放平台的设计与实现
下一篇:M财险公司客户关系管理研究