首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于图像高级语义与Attention融合的图像描述方法研究

摘要第4-5页
abstract第5-6页
第1章 绪论第12-19页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 基于模板的图像描述方法第13-14页
        1.2.2 基于语义迁移的图像描述方法第14页
        1.2.3 基于通道(Pipeline)的图像描述方法第14-15页
        1.2.4 基于“编码-解码”的图像描述方法第15-16页
    1.3 本文主要研究内容与章节安排第16-19页
        1.3.1 主要研究内容第16-17页
        1.3.2 章节安排第17-19页
第2章 基于神经网络图像描述的相关理论基础第19-33页
    2.1 卷积神经网络第19-25页
        2.1.1 神经网络基本理论第19-21页
        2.1.2 卷积层第21-23页
        2.1.3 池化层第23-24页
        2.1.4 激活函数第24-25页
    2.2 循环神经网络第25-30页
        2.2.1 循环神经网络基本理论第25-27页
        2.2.2 长短期记忆模型LSTM第27-30页
    2.3 神经网络训练及优化算法第30-32页
        2.3.1 误差反向传播算法第30-31页
        2.3.2 防止过拟合技术第31-32页
    2.4 本章小节第32-33页
第3章 基于CNN的图像高级语义提取方法第33-45页
    3.1 基于VGG的单标签模型训练第33-36页
        3.1.1 VGG模型结构第34-35页
        3.1.2 单标签分类网络预训练第35-36页
    3.2 基于多标签数据集的参数优化第36-39页
        3.2.1 基于MSCOCO数据集的字典构建算法第36-38页
        3.2.2 全连接层的调整与优化第38-39页
    3.3 基于候选区域选取的高级语义生成算法第39-44页
        3.3.1 基于二值化梯度特征的候选区域生成算法第39-42页
        3.3.2 基于IOU的候选区域筛选算法第42-44页
    3.4 本章小结第44-45页
第4章 基于Attention与多模态的文本生成方法第45-59页
    4.1 Word2Vec词嵌入向量空间算法第45-49页
        4.1.1 Skip-Gram模型第46-47页
        4.1.2 Skip-Gram训练第47-49页
    4.2 基于Attention的注意力自适应算法第49-54页
        4.2.1 Attention模型第50页
        4.2.2 基于Attention机制的图片描述生成算法第50-52页
        4.2.3 改进的自适应Attention机制第52-54页
    4.3 基于LSTM的多模态方法第54-58页
        4.3.1 多模态层融合Attention的描述生成方法第55-57页
        4.3.2 多模态网络训练第57-58页
    4.4 本章小结第58-59页
第5章 实验结果及分析第59-76页
    5.1 实验环境第59-62页
        5.1.1 实验硬件环境第59-60页
        5.1.2 实验软件环境第60-62页
    5.2 实验数据集第62-64页
        5.2.1 ImageNet数据集第62-63页
        5.2.2 MSCOCO数据集第63页
        5.2.3 Flickr30K数据集第63-64页
    5.3 实验评价标准第64-66页
        5.3.1 BLEU标准第64-65页
        5.3.2 METEOR标准第65页
        5.3.3 CIDEr标准第65-66页
    5.4 实验结果及分析第66-75页
        5.4.1 图像高级语义提取方法实验结果第66-70页
        5.4.2 多模态融合Attention的描述生成方法实验结果及分析第70-75页
    5.5 本章小结第75-76页
第6章 总结与展望第76-78页
    6.1 总结第76-77页
    6.2 进一步工作方向第77-78页
致谢第78-79页
参考文献第79-82页

论文共82页,点击 下载论文
上一篇:基于网格和密度比的DBSCAN算法研究
下一篇:基于多层次划分的大规模动态图分割方法研究