摘要 | 第1-6页 |
Abstract | 第6-7页 |
目录 | 第7-9页 |
第1章 绪论 | 第9-14页 |
·课题背景 | 第9页 |
·研究目的 | 第9-10页 |
·本文研究工作 | 第10-12页 |
·论文结构 | 第12-14页 |
第2章 多模态检索的相关研究 | 第14-21页 |
·引言 | 第14页 |
·主要困难 | 第14-15页 |
·多模态检索的研究现状 | 第15-20页 |
·跨语言检索 | 第15页 |
·融合分析 | 第15-17页 |
·图像-音频内容的统一表达 | 第17-18页 |
·图像(视频、音频)-文本的关系分析 | 第18-19页 |
·多模态的视频检索 | 第19-20页 |
·本章小结 | 第20-21页 |
第3章 基于概率潜在语义分析模型的多模态融合算法 | 第21-35页 |
·引言 | 第21-22页 |
·视觉、听觉特征的提取 | 第22-23页 |
·预处理 | 第23-24页 |
·图像表示 | 第23-24页 |
·音频表示 | 第24页 |
·PLSA 建模 | 第24-27页 |
·基于PLSA模型的多模态信息融合 | 第27-29页 |
·图像-音频的融合 | 第27-28页 |
·多模态关联性检索的过程 | 第28-29页 |
·采用PLSA模型的跨模态检索实验结果分析 | 第29-34页 |
·数据集的选取 | 第29页 |
·评价方法 | 第29页 |
·实验一:图像-音频互检索 | 第29-31页 |
·实验二:图像-文本间的跨模态关联 | 第31-34页 |
·本章小结 | 第34-35页 |
第4章 基于连续特征的多模态融合和传播的跨模态信息检索算法 | 第35-49页 |
·引言 | 第35-36页 |
·预处理 | 第36-38页 |
·图像表示 | 第36-37页 |
·音频表示 | 第37页 |
·多媒体文档表示 | 第37-38页 |
·多模态语义融合 | 第38-42页 |
·MC-PLSA模型 | 第38-40页 |
·不对称学习算法 | 第40-41页 |
·新对象的推导 | 第41-42页 |
·相似度计算 | 第42页 |
·多模态相似度传播模型 | 第42-45页 |
·传播模型描述 | 第42-43页 |
·相似度更新原理 | 第43-45页 |
·实验结果与分析 | 第45-48页 |
·本章小结 | 第48-49页 |
第5章 结束语 | 第49-51页 |
·本文成果 | 第49页 |
·未来展望 | 第49-51页 |
致谢 | 第51-52页 |
参考文献 | 第52-55页 |
附录 | 第55-56页 |
附录A 攻读硕士学位期间发表的学术论文 | 第55-56页 |