首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于多模态内容分析的多视角视频推荐技术研究

摘要第5-7页
Abstract第7-9页
第1章 引言第14-28页
    1.1 研究背景第14-22页
        1.1.1 多媒体推荐系统简介第15-18页
        1.1.2 视频推荐系统研究现状第18-20页
        1.1.3 视频推荐中存在的问题及挑战第20-22页
    1.2 问题提出第22-25页
        1.2.1 基于多模态内容的多视角视频推荐中存在的问题第23-24页
        1.2.2 本文的解决策略第24-25页
    1.3 本文主要研究内容及贡献第25-26页
    1.4 论文结构第26-28页
第2章 相关理论与技术第28-44页
    2.1 推荐系统研究第28-34页
        2.1.1 基于内容过滤的推荐方法第29-30页
        2.1.2 基于协同过滤的推荐方法第30-32页
        2.1.3 基于人口统计学的推荐方法第32页
        2.1.4 基于知识的推荐方法第32页
        2.1.5 基于社群的推荐方法第32页
        2.1.6 基于混合过滤的推荐方法第32-33页
        2.1.7 基于上下文的推荐方法第33-34页
    2.2 跨领域推荐研究第34-35页
    2.3 视频推荐研究第35-36页
    2.4 本文相关的领域研究现状第36-42页
        2.4.1 视频的表示第36-37页
        2.4.2 多模态融合的研究第37-40页
        2.4.3 度量学习第40-41页
        2.4.4 视频摘要第41-42页
    2.5 本章小结第42-44页
第3章 基于多模态中间语义的特征提取 及度量学习第44-64页
    3.1 问题的提出第44-46页
    3.2 相关工作第46-47页
        3.2.1 多媒体表示第46页
        3.2.2 视频标注第46-47页
        3.2.3 度量学习第47页
    3.3 特征提取及表示第47-52页
        3.3.1 文本的特征提取与表示第47-48页
        3.3.2 音频的特征提取与表示第48-50页
        3.3.3 图像的特征提取与表示第50-51页
        3.3.4 视频的特征提取与表示第51-52页
    3.4 符号表示及问题定义第52-54页
        3.4.1 多模态概念定义第53页
        3.4.2 基于多模态概念的视频相似性度量第53-54页
        3.4.3 问题定义第54页
    3.5 基于中间语义的特征融合及度量学习第54-58页
        3.5.1 中间语义学习第55-56页
        3.5.2 基于中间语义的度量学习第56-58页
    3.6 实验测试与分析第58-63页
        3.6.1 实验数据第58-59页
        3.6.2 实验设置第59-60页
        3.6.3 对比方法第60-61页
        3.6.4 实验结果第61-63页
    3.7 本章小结第63-64页
第4章 基于半监督增强的视频推荐第64-80页
    4.1 问题的提出第64-65页
    4.2 相关工作第65-67页
    4.3. 问题定义及符号表示第67-72页
        4.3.1 问题定义第67-68页
        4.3.2 视频的多模态表示第68-71页
        4.3.3 单模态内特征相似性度量第71-72页
    4.4 基于多模态的半监督增强视频推荐第72-75页
        4.4.1 单模态评分分配第72页
        4.4.2 单模态推荐第72-73页
        4.4.3 半监督增强第73-74页
        4.4.4 多模态推荐第74-75页
    4.5 实验测试与分析第75-79页
        4.5.1 数据集第75-76页
        4.5.2 实验结果第76-79页
    4.6 本章小结第79-80页
第5章 基于运动序列的视频摘要推荐第80-96页
    5.1 问题的提出第80-81页
    5.2 相关工作第81-82页
    5.3 问题定义及模型构建第82-84页
        5.3.1 IE-RoleNet定义及IE-RoleNet序列第82-83页
        5.3.2 问题定义第83-84页
    5.4 视频语义内容分析第84-86页
        5.4.1 视频结构分析第84页
        5.4.2 人物识别及跟踪第84-85页
        5.4.3 基于交互原子的关系分析第85-86页
        5.4.4 说话者的情感检测第86页
    5.5 基于运动序列的视频摘要推荐第86-90页
        5.5.1 子序列挖掘第86-88页
        5.5.2 基于结构的内容可视化第88-89页
        5.5.3 人物为中心的内容可视化第89-90页
    5.6 实验测试与分析第90-94页
        5.6.1 信息检索标准第91-92页
        5.6.2 用户体验第92-94页
    5.7 本章小结第94-96页
第6章 基于视频特征关联性的跨模态推荐第96-112页
    6.1 问题的提出第96-97页
    6.2 相关工作第97-100页
        6.2.1 跨模态推荐第97-98页
        6.2.2 跨模态检索第98-99页
        6.2.3 多模态深度学习第99-100页
    6.3 符号定义及模型描述第100-101页
        6.3.1 符号定义及表示第100-101页
        6.3.2 模型描述第101页
    6.4 基于多模态深度学习的跨模态推荐第101-106页
        6.4.1 多模态深度学习第101-105页
        6.4.2 基于多模态共享特征的跨模态推荐第105-106页
    6.5 实验测试与分析第106-110页
        6.5.1 实验数据及设置第107页
        6.5.2 评价标准第107-108页
        6.5.3 对比方法第108页
        6.5.4 实验结果第108-110页
    6.6 本章小结第110-112页
第7章 结论第112-116页
    7.1 论文工作总结第112-113页
    7.2 未来的工作和展望第113-116页
参考文献第116-136页
致谢第136-138页
攻读博士学位期间发表的论文第138-140页
攻博期间参与的科研项目第140页

论文共140页,点击 下载论文
上一篇:基于混沌动力学的图像加密技术与密码学分析
下一篇:概率XML数据中关键字检索算法研究