基于多模态信息视频语义检索技术研究

摘要	第5-6页
ABSTRACT	第6页
第1章绪论	第11-17页
1.1 研究背景与意义	第11-13页
1.2 研究现状	第13-16页
1.3 研究内容	第16页
1.4 论文组织结构	第16-17页
第2章视频信息的表示、分析和应用	第17-29页
2.1 结构化处理	第17-18页
2.2 视觉特征提取	第18-24页
2.2.1 传统视觉特征	第19-22页
2.2.2 视觉不变量特征	第22-24页
2.3 音频特征提取	第24-27页
2.4 视频片段检索及其性能评估	第27-29页
2.4.1 视频片段检索	第27页
2.4.2 视频检索性能评估	第27-29页
第3章多模态信息特征的分析、提取和应用	第29-45页
3.1 关键帧提取	第29页
3.2 视频中的语义概念检测	第29-37页
3.2.1 视觉特征提取	第29-31页
3.2.2 视觉特征分类算法	第31页
3.2.3 语义概念检测	第31-37页
3.3 视频情感语义检测	第37-45页
3.3.1 视频情感数据库的构建	第38-39页
3.3.2 视觉和音频情感特征的分析提取	第39-42页
3.3.3 未确知情感度的判定	第42-45页
第4章基于多模态信息的新闻类视频语义分析与检索	第45-55页
4.1 新闻类视频的分层音频分类算法	第45-47页
4.2 辅以音频的新闻镜头语义分类	第47-49页
4.3 自适应的多模态融合算法	第49-51页
4.4 新闻视频故事场景分割与检测	第51-55页
第5章基于多模态信息的视频语义检索系统的实现	第55-63页
5.1 基于多模态信息的视频检索实验平台的架构	第55-57页
5.2 视频中情感语义的分析识别	第57-60页
5.3 新闻类视频语义分析检索子系统	第60-63页
总结	第63-65页
工作总结	第63-64页
研究展望	第64-65页
参考文献	第65-69页
致谢	第69页