| 摘要 | 第1-10页 |
| ABSTRACT | 第10-12页 |
| 第1章 绪论 | 第12-20页 |
| ·研究背景 | 第12-13页 |
| ·研究问题与相关工作 | 第13-16页 |
| ·研究目标与贡献 | 第16-18页 |
| ·论文组织 | 第18-20页 |
| 第2章 跨媒体检索相关研究综述 | 第20-33页 |
| ·跨媒体的定义 | 第21-23页 |
| ·人脑认知的跨媒体特性 | 第21-22页 |
| ·主要研究范畴 | 第22-23页 |
| ·本文的定位 | 第23页 |
| ·融合分析 | 第23-26页 |
| ·图像内容特征的融合分析 | 第24-25页 |
| ·视频多通道特征的融合分析 | 第25-26页 |
| ·主要应用 | 第26页 |
| ·关联挖掘 | 第26-28页 |
| ·交叉索引关系 | 第27页 |
| ·链接关联模型 | 第27-28页 |
| ·多媒体关系图 | 第28页 |
| ·类跨媒体检索的研究 | 第28-32页 |
| ·跨语言检索 | 第29-30页 |
| ·文本—视频(图像)之间的统计分析和互检索 | 第30页 |
| ·基于直接语义关系的多媒体检索 | 第30-31页 |
| ·视频流中的说话人脸检测 | 第31-32页 |
| ·小结 | 第32-33页 |
| 第3章 异构特征间的典型相关性学习 | 第33-43页 |
| ·跨媒体的内容鸿沟 | 第33-35页 |
| ·不同内容特征间的相关性分析 | 第35-37页 |
| ·典型相关性定义 | 第35页 |
| ·视觉特征和听觉特征之间的典型相关性 | 第35-37页 |
| ·本方法的优点 | 第37页 |
| ·基于相关性的图像—音频聚类 | 第37-38页 |
| ·测试结果 | 第38-41页 |
| ·预处理 | 第38-39页 |
| ·相关性保持结果的对比分析 | 第39-40页 |
| ·聚类结果检测 | 第40-41页 |
| ·小结 | 第41-43页 |
| 第4章 图像和音频内容的统一表达 | 第43-55页 |
| ·引言 | 第43-44页 |
| ·半监督式的相关性保持映射(SSCPM) | 第44-46页 |
| ·SSCPM算法描述 | 第44-45页 |
| ·基于通用距离函数的跨媒体相关性计算 | 第45-46页 |
| ·动态相关性排序 | 第46-48页 |
| ·算法描述 | 第46-47页 |
| ·相关性度量分析: SSCPMdis和Crodis的比较 | 第47-48页 |
| ·新媒体对象在同构子空间中的定位 | 第48-49页 |
| ·实验分析 | 第49-54页 |
| ·SSCPM子空间维数选取 | 第49-50页 |
| ·不同方法得到的跨媒体检索结果 | 第50-51页 |
| ·相关反馈对跨媒体检索性能的改善 | 第51-52页 |
| ·相关性保持映射对图像的聚类检测 | 第52-54页 |
| ·小结 | 第54-55页 |
| 第5章 跨媒体语义的非线性学习 | 第55-68页 |
| ·引言 | 第55-56页 |
| ·基于流形学习的本征参数求取 | 第56-60页 |
| ·多特征观测空间 | 第56-57页 |
| ·非线性流形 | 第57-58页 |
| ·关联矩阵 | 第58-59页 |
| ·本征参数计算 | 第59-60页 |
| ·基于短期修正和长期修正的相关性求精 | 第60-61页 |
| ·非线性的新数据引入算法 | 第61-62页 |
| ·方法1:几何定位法 | 第61-62页 |
| ·方法2:交互定位法 | 第62页 |
| ·实验分析 | 第62-66页 |
| ·多模态检索性能 | 第63-64页 |
| ·图像和音频的交叉检索性能 | 第64-65页 |
| ·定位算法检测 | 第65-66页 |
| ·小结 | 第66-68页 |
| 第6章 基于WEB的跨媒体相关性推理 | 第68-78页 |
| ·引言 | 第68-69页 |
| ·图模型的建立 | 第69-71页 |
| ·预处理 | 第69-70页 |
| ·跨媒体的链接分析 | 第70页 |
| ·跨媒体关联图(CMCG) | 第70-71页 |
| ·全局相关性推理 | 第71-73页 |
| ·CMCG的更新 | 第73-74页 |
| ·实验分析 | 第74-77页 |
| ·逻辑结构 | 第74-75页 |
| ·数据结构 | 第75页 |
| ·跨媒体检索性能 | 第75-76页 |
| ·查询例子不在数据库中的检索性能 | 第76-77页 |
| ·小结 | 第77-78页 |
| 第7章 图像和音频特征的共生关系学习 | 第78-88页 |
| ·引言 | 第78页 |
| ·预处理:视觉和听觉特征的共生估计 | 第78-80页 |
| ·隐性语义索引 | 第79页 |
| ·跨媒体特征共生矩阵的最优估计 | 第79-80页 |
| ·基于相似度传递的共生关系优化算法 | 第80-82页 |
| ·形式化描述和收敛性证明 | 第80-81页 |
| ·算法分析 | 第81-82页 |
| ·基于主动学习的相关反馈 | 第82-84页 |
| ·步骤1:候选集计算 | 第82-83页 |
| ·步骤2:对未标注样本的主动学习 | 第83-84页 |
| ·实验分析 | 第84-87页 |
| ·矩阵秩r的选取 | 第84-85页 |
| ·主动学习策略对检索性能的影响 | 第85-86页 |
| ·LSI-Active和CCA-Passive方法的性能对比 | 第86-87页 |
| ·小结 | 第87-88页 |
| 第8章 系统框架设计与实现 | 第88-105页 |
| ·引言 | 第88页 |
| ·跨媒体海量信息的综合检索与智能技术系统的整体设计 | 第88-90页 |
| ·跨媒体检索子系统的设计和实现 | 第90-96页 |
| ·CMRS子系统的总体框架设计 | 第90-93页 |
| ·CMRS之:基于典型相关性分析的图像—音频检索 | 第93-94页 |
| ·CMRS之:视频—图像—音频检索 | 第94-95页 |
| ·跨媒体检索在数字图书馆项目CADAL中的应用 | 第95-96页 |
| ·基于网格的CADAL资源管理 | 第96-104页 |
| ·主要技术问题 | 第97-98页 |
| ·网格环境中的资源管理 | 第98页 |
| ·基于网格的CADAL软件层次结构 | 第98-100页 |
| ·CADAL网格构架 | 第100-101页 |
| ·仿真实验 | 第101-104页 |
| ·小结 | 第104-105页 |
| 第9章 结论与展望 | 第105-109页 |
| ·结论 | 第105-106页 |
| ·展望 | 第106-109页 |
| 参考文献 | 第109-118页 |
| 攻读博士学位期间发表的论文及科研情况 | 第118-119页 |
| 致谢 | 第119页 |