| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 目录 | 第7-9页 |
| 第1章 绪论 | 第9-14页 |
| ·课题背景 | 第9页 |
| ·研究目的 | 第9-10页 |
| ·本文研究工作 | 第10-12页 |
| ·论文结构 | 第12-14页 |
| 第2章 多模态检索的相关研究 | 第14-21页 |
| ·引言 | 第14页 |
| ·主要困难 | 第14-15页 |
| ·多模态检索的研究现状 | 第15-20页 |
| ·跨语言检索 | 第15页 |
| ·融合分析 | 第15-17页 |
| ·图像-音频内容的统一表达 | 第17-18页 |
| ·图像(视频、音频)-文本的关系分析 | 第18-19页 |
| ·多模态的视频检索 | 第19-20页 |
| ·本章小结 | 第20-21页 |
| 第3章 基于概率潜在语义分析模型的多模态融合算法 | 第21-35页 |
| ·引言 | 第21-22页 |
| ·视觉、听觉特征的提取 | 第22-23页 |
| ·预处理 | 第23-24页 |
| ·图像表示 | 第23-24页 |
| ·音频表示 | 第24页 |
| ·PLSA 建模 | 第24-27页 |
| ·基于PLSA模型的多模态信息融合 | 第27-29页 |
| ·图像-音频的融合 | 第27-28页 |
| ·多模态关联性检索的过程 | 第28-29页 |
| ·采用PLSA模型的跨模态检索实验结果分析 | 第29-34页 |
| ·数据集的选取 | 第29页 |
| ·评价方法 | 第29页 |
| ·实验一:图像-音频互检索 | 第29-31页 |
| ·实验二:图像-文本间的跨模态关联 | 第31-34页 |
| ·本章小结 | 第34-35页 |
| 第4章 基于连续特征的多模态融合和传播的跨模态信息检索算法 | 第35-49页 |
| ·引言 | 第35-36页 |
| ·预处理 | 第36-38页 |
| ·图像表示 | 第36-37页 |
| ·音频表示 | 第37页 |
| ·多媒体文档表示 | 第37-38页 |
| ·多模态语义融合 | 第38-42页 |
| ·MC-PLSA模型 | 第38-40页 |
| ·不对称学习算法 | 第40-41页 |
| ·新对象的推导 | 第41-42页 |
| ·相似度计算 | 第42页 |
| ·多模态相似度传播模型 | 第42-45页 |
| ·传播模型描述 | 第42-43页 |
| ·相似度更新原理 | 第43-45页 |
| ·实验结果与分析 | 第45-48页 |
| ·本章小结 | 第48-49页 |
| 第5章 结束语 | 第49-51页 |
| ·本文成果 | 第49页 |
| ·未来展望 | 第49-51页 |
| 致谢 | 第51-52页 |
| 参考文献 | 第52-55页 |
| 附录 | 第55-56页 |
| 附录A 攻读硕士学位期间发表的学术论文 | 第55-56页 |