摘要 | 第1-10页 |
ABSTRACT | 第10-12页 |
第1章 绪论 | 第12-20页 |
·研究背景 | 第12-13页 |
·研究问题与相关工作 | 第13-16页 |
·研究目标与贡献 | 第16-18页 |
·论文组织 | 第18-20页 |
第2章 跨媒体检索相关研究综述 | 第20-33页 |
·跨媒体的定义 | 第21-23页 |
·人脑认知的跨媒体特性 | 第21-22页 |
·主要研究范畴 | 第22-23页 |
·本文的定位 | 第23页 |
·融合分析 | 第23-26页 |
·图像内容特征的融合分析 | 第24-25页 |
·视频多通道特征的融合分析 | 第25-26页 |
·主要应用 | 第26页 |
·关联挖掘 | 第26-28页 |
·交叉索引关系 | 第27页 |
·链接关联模型 | 第27-28页 |
·多媒体关系图 | 第28页 |
·类跨媒体检索的研究 | 第28-32页 |
·跨语言检索 | 第29-30页 |
·文本—视频(图像)之间的统计分析和互检索 | 第30页 |
·基于直接语义关系的多媒体检索 | 第30-31页 |
·视频流中的说话人脸检测 | 第31-32页 |
·小结 | 第32-33页 |
第3章 异构特征间的典型相关性学习 | 第33-43页 |
·跨媒体的内容鸿沟 | 第33-35页 |
·不同内容特征间的相关性分析 | 第35-37页 |
·典型相关性定义 | 第35页 |
·视觉特征和听觉特征之间的典型相关性 | 第35-37页 |
·本方法的优点 | 第37页 |
·基于相关性的图像—音频聚类 | 第37-38页 |
·测试结果 | 第38-41页 |
·预处理 | 第38-39页 |
·相关性保持结果的对比分析 | 第39-40页 |
·聚类结果检测 | 第40-41页 |
·小结 | 第41-43页 |
第4章 图像和音频内容的统一表达 | 第43-55页 |
·引言 | 第43-44页 |
·半监督式的相关性保持映射(SSCPM) | 第44-46页 |
·SSCPM算法描述 | 第44-45页 |
·基于通用距离函数的跨媒体相关性计算 | 第45-46页 |
·动态相关性排序 | 第46-48页 |
·算法描述 | 第46-47页 |
·相关性度量分析: SSCPMdis和Crodis的比较 | 第47-48页 |
·新媒体对象在同构子空间中的定位 | 第48-49页 |
·实验分析 | 第49-54页 |
·SSCPM子空间维数选取 | 第49-50页 |
·不同方法得到的跨媒体检索结果 | 第50-51页 |
·相关反馈对跨媒体检索性能的改善 | 第51-52页 |
·相关性保持映射对图像的聚类检测 | 第52-54页 |
·小结 | 第54-55页 |
第5章 跨媒体语义的非线性学习 | 第55-68页 |
·引言 | 第55-56页 |
·基于流形学习的本征参数求取 | 第56-60页 |
·多特征观测空间 | 第56-57页 |
·非线性流形 | 第57-58页 |
·关联矩阵 | 第58-59页 |
·本征参数计算 | 第59-60页 |
·基于短期修正和长期修正的相关性求精 | 第60-61页 |
·非线性的新数据引入算法 | 第61-62页 |
·方法1:几何定位法 | 第61-62页 |
·方法2:交互定位法 | 第62页 |
·实验分析 | 第62-66页 |
·多模态检索性能 | 第63-64页 |
·图像和音频的交叉检索性能 | 第64-65页 |
·定位算法检测 | 第65-66页 |
·小结 | 第66-68页 |
第6章 基于WEB的跨媒体相关性推理 | 第68-78页 |
·引言 | 第68-69页 |
·图模型的建立 | 第69-71页 |
·预处理 | 第69-70页 |
·跨媒体的链接分析 | 第70页 |
·跨媒体关联图(CMCG) | 第70-71页 |
·全局相关性推理 | 第71-73页 |
·CMCG的更新 | 第73-74页 |
·实验分析 | 第74-77页 |
·逻辑结构 | 第74-75页 |
·数据结构 | 第75页 |
·跨媒体检索性能 | 第75-76页 |
·查询例子不在数据库中的检索性能 | 第76-77页 |
·小结 | 第77-78页 |
第7章 图像和音频特征的共生关系学习 | 第78-88页 |
·引言 | 第78页 |
·预处理:视觉和听觉特征的共生估计 | 第78-80页 |
·隐性语义索引 | 第79页 |
·跨媒体特征共生矩阵的最优估计 | 第79-80页 |
·基于相似度传递的共生关系优化算法 | 第80-82页 |
·形式化描述和收敛性证明 | 第80-81页 |
·算法分析 | 第81-82页 |
·基于主动学习的相关反馈 | 第82-84页 |
·步骤1:候选集计算 | 第82-83页 |
·步骤2:对未标注样本的主动学习 | 第83-84页 |
·实验分析 | 第84-87页 |
·矩阵秩r的选取 | 第84-85页 |
·主动学习策略对检索性能的影响 | 第85-86页 |
·LSI-Active和CCA-Passive方法的性能对比 | 第86-87页 |
·小结 | 第87-88页 |
第8章 系统框架设计与实现 | 第88-105页 |
·引言 | 第88页 |
·跨媒体海量信息的综合检索与智能技术系统的整体设计 | 第88-90页 |
·跨媒体检索子系统的设计和实现 | 第90-96页 |
·CMRS子系统的总体框架设计 | 第90-93页 |
·CMRS之:基于典型相关性分析的图像—音频检索 | 第93-94页 |
·CMRS之:视频—图像—音频检索 | 第94-95页 |
·跨媒体检索在数字图书馆项目CADAL中的应用 | 第95-96页 |
·基于网格的CADAL资源管理 | 第96-104页 |
·主要技术问题 | 第97-98页 |
·网格环境中的资源管理 | 第98页 |
·基于网格的CADAL软件层次结构 | 第98-100页 |
·CADAL网格构架 | 第100-101页 |
·仿真实验 | 第101-104页 |
·小结 | 第104-105页 |
第9章 结论与展望 | 第105-109页 |
·结论 | 第105-106页 |
·展望 | 第106-109页 |
参考文献 | 第109-118页 |
攻读博士学位期间发表的论文及科研情况 | 第118-119页 |
致谢 | 第119页 |