首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

图像内容的语义描述与理解

摘要第5-7页
abstract第7-9页
第1章 绪论第15-25页
    1.1 研究背景与意义第15-16页
    1.2 研究现状与发展趋势第16-21页
        1.2.1 基于深度学习的序列学习第17-18页
        1.2.2 图像文本描述(ImageCaptioning)第18-19页
        1.2.3 视觉问答(VisualQuestionAnswering)第19-21页
    1.3 研究目标与研究内容第21-23页
        1.3.1 研究目标第21-22页
        1.3.2 研究内容第22-23页
    1.4 创新之处第23-24页
    1.5 论文的组织安排第24-25页
第2章 深度学习基础知识准备第25-41页
    2.1 有监督学习第25-26页
        2.1.1 目标函数第25-26页
        2.1.2 正则约束第26页
    2.2 优化算法第26-29页
        2.2.1 随机梯度下降(SGD)第26-27页
        2.2.2 AdaGrad算法第27-28页
        2.2.3 RMSProp算法第28页
        2.2.4 Adam算法第28-29页
    2.3 卷积神经网络(CNN)第29-30页
    2.4 递归神经网络(RNN)第30-39页
        2.4.1 “Vanilla”RNN第31-32页
        2.4.2 LSTM第32-33页
        2.4.3 GRU第33-35页
        2.4.4 堆叠RNN第35-39页
    2.5 本章小结第39-41页
第3章 基于门控递归单元的图像文本描述算法第41-61页
    3.1 引言第41-43页
    3.2 研究方法第43-47页
        3.2.1 图像特征表达第44-45页
        3.2.2 自然语句表达第45页
        3.2.3 描述语句生成第45-47页
    3.3 实验结果分析与讨论第47-60页
        3.3.1 数据集第47-48页
        3.3.2 评价标准第48-50页
        3.3.3 对比模型第50-52页
        3.3.4 性能分析第52-60页
    3.4 本章小结第60-61页
第4章 基于图像全局-局部特征及注意力机制的图像文本描述算法第61-83页
    4.1 引言第61-64页
    4.2 研究方法第64-71页
        4.2.1 图像特征表达第66页
        4.2.2 句子特征表达第66-67页
        4.2.3 门控反馈LSTM语句生生第67-71页
    4.3 实验结果分析与讨论第71-81页
        4.3.1 数据集第71页
        4.3.2 评价指标第71-72页
        4.3.3 对比模型第72页
        4.3.4 实验设置第72-73页
        4.3.5 性能分析第73-81页
    4.4 本章小结第81-83页
第5章 基于属性及注意力机制的视觉到语言任务算法第83-105页
    5.1 引言第83-85页
    5.2 研究方法第85-93页
        5.2.1 图像属性预测第86-87页
        5.2.2 图像局部特征表达第87-88页
        5.2.3 基于语义指导的注意力机制第88-89页
        5.2.4 图像描述第89-91页
        5.2.5 视觉问答第91-93页
    5.3 实验结果分析与讨论第93-102页
        5.3.1 实验设置第93-94页
        5.3.2 图像描述第94-99页
        5.3.3 图像问答第99-102页
    5.4 本章小结第102-105页
第6章 总结与展望第105-109页
    6.1 总结第105-106页
    6.2 展望第106-109页
参考文献第109-123页
致谢第123-125页
作者简历及攻读学位期间发表的学术论文与研究成果第125-126页

论文共126页,点击 下载论文
上一篇:福柯的身体思想研究
下一篇:配电高压架空线路雷击故障对武鸣电网可靠性影响的研究