首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

面向图文游记的多模态学习

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 研究背景及内容第11-13页
    1.2 研究现状概述第13-15页
    1.3 研究成果及意义第15-16页
    1.4 论文组织结构第16-17页
第二章 模型研究背景与关键技术第17-33页
    2.1 深度学习背景知识第17-21页
        2.1.1 激活层第17-18页
        2.1.2 剔除层第18页
        2.1.3 反向传播算法第18-19页
        2.1.4 提前终止第19-20页
        2.1.5 数据集增强第20-21页
    2.2 图像特征提取模型第21-23页
        2.2.1 基本组成第21-23页
        2.2.2 批量归一化层第23页
    2.3 文本特征提取模型第23-26页
        2.3.1 词向量模型第24-25页
        2.3.2 句向量模型第25-26页
    2.4 视觉故事第26-27页
    2.5 生成对抗网络第27-29页
    2.6 KERAS简介第29-31页
    2.7 本章小结第31-33页
第三章 多模态图文游记生成模型第33-49页
    3.1 长记忆视觉故事模型第33-37页
        3.1.1 图像与文本特征提取第33-34页
        3.1.2 模态转换第34-35页
        3.1.3 多模态映射第35-36页
        3.1.4 模型结构第36-37页
        3.1.5 本节小结第37页
    3.2 注意力视觉故事模型第37-41页
        3.2.1 模态转换第38页
        3.2.2 注意力机制第38-39页
        3.2.3 模型结构第39-40页
        3.2.4 本节小结第40-41页
    3.3 对抗视觉故事模型第41-47页
        3.3.1 传统模型的问题第41-43页
        3.3.2 模型结构第43-44页
        3.3.3 生成结构第44页
        3.3.4 对抗结构第44-46页
        3.3.5 本节小结第46-47页
    3.4 本章小结第47-49页
第四章 多模态视觉故事实验第49-65页
    4.1 数据集第49-50页
    4.2 模型方法对比第50-51页
    4.3 模型实现第51-54页
        4.3.1 双向长短期记忆网络实现第51-52页
        4.3.2 注意力机制实现第52页
        4.3.3 排列损失函数实现第52-53页
        4.3.4 条件生成对抗训练实现第53-54页
    4.4 模型训练第54-56页
    4.5 实验结果第56-63页
        4.5.1 计算复杂度分析第56-57页
        4.5.2 模型收敛性分析第57-59页
        4.5.3 实验结果分析第59-63页
    4.6 本章小结第63-65页
第五章 图文游记写作系统第65-73页
    5.1 图文游记写作系统需求第65-66页
    5.2 离线训练系统第66-67页
        5.2.1 数据获取模块第66页
        5.2.2 数据处理模块第66-67页
        5.2.3 数据存储模块第67页
        5.2.4 多模态训练模块第67页
    5.3 在线图文游记写作系统第67-71页
        5.3.1 系统架构第68页
        5.3.2 数据源第68页
        5.3.3 数据存储层第68页
        5.3.4 平台计算层第68-69页
        5.3.5 应用功能层第69-71页
        5.3.6 性能测试第71页
    5.4 本章小结第71-73页
第六章 总结与展望第73-77页
    6.1 总结第73-74页
    6.2 展望第74-77页
参考文献第77-81页
附录第81-83页
    附录1 缩略词表第81-83页
致谢第83-85页
攻读学位期间发表的学术论文目录第85页

论文共85页,点击 下载论文
上一篇:神经网络算法在电磁泄露及脑电信息认知中的应用
下一篇:黑龙江漠河江段冰层热力学参数检测与冰厚模型优化研究