| 致谢 | 第1-7页 |
| 摘要 | 第7-9页 |
| Abstract | 第9-14页 |
| 第一章 绪论 | 第14-28页 |
| ·引言 | 第14-17页 |
| ·基于内容的多媒体搜索的研究现状 | 第17-24页 |
| ·研究的主要问题及贡献 | 第24-26页 |
| ·论文组织结构 | 第26-28页 |
| 第二章 交互式多媒体搜索中多视角协同学习 | 第28-50页 |
| ·引言 | 第28-30页 |
| ·问题描述及分析 | 第30-32页 |
| ·系统的整体架构 | 第32页 |
| ·基于文本的视频搜索引擎 | 第32-36页 |
| ·基本思想 | 第33页 |
| ·文本-镜头映射 | 第33-35页 |
| ·查询度量 | 第35-36页 |
| ·基于多视角协同学习的交互式搜索算法 | 第36-39页 |
| ·多视角协同学习 | 第36-37页 |
| ·多视角特征提取 | 第37-38页 |
| ·SVM最优参数选择 | 第38-39页 |
| ·实验 | 第39-46页 |
| ·实验数据 | 第39页 |
| ·评价准则 | 第39-40页 |
| ·实验结果及分析 | 第40-46页 |
| ·本章小结 | 第46-50页 |
| 第三章 视频重排序中多模态信息融合方法 | 第50-72页 |
| ·引言 | 第50-53页 |
| ·问题描述及分析 | 第53-55页 |
| ·现有搜索引擎的不足 | 第53页 |
| ·可行性分析 | 第53-55页 |
| ·系统的整体架构 | 第55-56页 |
| ·基于多模态融合的视频重排序方法 | 第56-60页 |
| ·多模态聚类策略 | 第56页 |
| ·聚类结果的等级化 | 第56-58页 |
| ·多模态协同推断策略 | 第58-60页 |
| ·理论分析 | 第60-63页 |
| ·定义识别帧(FOD) | 第60-61页 |
| ·设计信任函数 | 第61-62页 |
| ·融合多个证据 | 第62-63页 |
| ·实验 | 第63-69页 |
| ·实验数据 | 第63-64页 |
| ·自动初始搜索 | 第64页 |
| ·评价准则 | 第64页 |
| ·实验结果及分析 | 第64-69页 |
| ·本章小结 | 第69-72页 |
| 第四章 高层概念间语义关联信息的融合方法 | 第72-86页 |
| ·引言 | 第72-73页 |
| ·系统的整体架构 | 第73-74页 |
| ·基于概念间语义关联信息融合的概念检测算法 | 第74-81页 |
| ·构建基准概念检测器 | 第74-75页 |
| ·定义本体内概念间的逻辑关系 | 第75-78页 |
| ·建立本体层次化体系 | 第78-80页 |
| ·概念检测器融合策略 | 第80-81页 |
| ·实验 | 第81-84页 |
| ·实验数据 | 第81-82页 |
| ·评价指标 | 第82页 |
| ·实验结果和分析 | 第82-84页 |
| ·小结 | 第84-86页 |
| 第五章 基于帧融合的拷贝检测方法 | 第86-116页 |
| ·引言 | 第86-88页 |
| ·系统的整体架构 | 第88-92页 |
| ·关键帧提取(KeyFrame Extraction) | 第88-90页 |
| ·特征提取 | 第90-91页 |
| ·相似性搜索和索引 | 第91页 |
| ·帧融合 | 第91-92页 |
| ·帧融合的一般模式 | 第92-97页 |
| ·问题定义 | 第92-93页 |
| ·解决方案 | 第93-97页 |
| ·Viterbi-Like的帧融合方法 | 第97-105页 |
| ·Viterbi-Like算法 | 第98-104页 |
| ·路径剪切和拷贝定位 | 第104-105页 |
| ·实验 | 第105-111页 |
| ·参考视频数据库 | 第105-106页 |
| ·查询视频的构造 | 第106页 |
| ·评价准则 | 第106-108页 |
| ·实验结果及分析 | 第108-111页 |
| ·小结 | 第111-116页 |
| 第六章 总结与展望 | 第116-120页 |
| ·论文工作的总结 | 第116-118页 |
| ·工作展望 | 第118-120页 |
| 参考文献 | 第120-132页 |
| 攻读博士学位期间发表的论文 | 第132-136页 |
| 学位论文数据集 | 第136页 |