基于统计学的视频语义分析与提取技术研究
摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-12页 |
图清单 | 第12-14页 |
表清单 | 第14-15页 |
缩略词及中英文词汇对照 | 第15-18页 |
1 绪论 | 第18-34页 |
·研究背景 | 第18-21页 |
·非语义视频内容分析 | 第18-19页 |
·视频语义分析 | 第19-21页 |
·国内外研究现状 | 第21-30页 |
·视频语义内容分析 | 第21-23页 |
·语义分析方法对比与总结 | 第23-29页 |
·相关标准 | 第29-30页 |
·课题来源 | 第30页 |
·本文主要工作及创新点 | 第30-32页 |
·本文主要工作 | 第30-31页 |
·本文创新点 | 第31-32页 |
·论文组织结构 | 第32-33页 |
·本章小结 | 第33-34页 |
2 视频语义内容分析 | 第34-59页 |
·引言 | 第34页 |
·镜头边界检测与分割 | 第34-44页 |
·基于统计分布的渐变镜头检测与分割 | 第34-35页 |
·特征量提取与测量准则建立 | 第35-36页 |
·渐变镜头边界检测 | 第36-40页 |
·实验与分析 | 第40-44页 |
·视频运动对象分割 | 第44-48页 |
·全局运动计算与补偿 | 第45-46页 |
·对象分割 | 第46-47页 |
·实例实验 | 第47-48页 |
·低层特征抽取 | 第48-58页 |
·静态视觉特征 | 第48-50页 |
·运动特征 | 第50-53页 |
·音频特征 | 第53页 |
·实验与分析 | 第53-58页 |
·本章小结 | 第58-59页 |
3 视觉语义分析与理解 | 第59-83页 |
·引言 | 第59页 |
·基于时空注意力模型的基本视觉语义分析 | 第59-68页 |
·注意力机制选择显著区域 | 第60-61页 |
·视觉基本语义识别 | 第61-62页 |
·视觉基本语义分类识别的特征选择算法 | 第62-66页 |
·实验与分析 | 第66-68页 |
·具有多峰正态分布属性的基本视觉语义识别 | 第68-73页 |
·原理与解决思路 | 第68-69页 |
·定步长组合划分方法 | 第69-71页 |
·实验与分析 | 第71-73页 |
·高层视觉语义分析 | 第73-81页 |
·高层视觉语义模型构建 | 第74-75页 |
·关键帧策略与时间语义语境约束线索 | 第75-76页 |
·模型参数估计 | 第76-78页 |
·时间语义的可观察符号 | 第78-80页 |
·实验与分析 | 第80-81页 |
·本章小结 | 第81-83页 |
4 音频语义分析与理解 | 第83-102页 |
·引言 | 第83页 |
·基本声音语义分析 | 第83-93页 |
·基本声音语义模型 | 第83-84页 |
·基本声音语义识别系统模型 | 第84页 |
·谱特征提取 | 第84-88页 |
·基本声音语义模型训练 | 第88-89页 |
·基本声音语义识别 | 第89-90页 |
·实验与分析 | 第90-93页 |
·音频高层语义分析 | 第93-101页 |
·音频高层语义建模 | 第94-96页 |
·音频高层语义提取 | 第96-99页 |
·实验与分析 | 第99-101页 |
·本章小结 | 第101-102页 |
5 视频语义分析两级多模式信息融合 | 第102-110页 |
·引言 | 第102页 |
·模式划分与融合原理 | 第102-104页 |
·融合模型与融合算法 | 第104-107页 |
·实验与分析 | 第107-109页 |
·本章小结 | 第109-110页 |
6 结论与展望 | 第110-113页 |
·总结 | 第110-111页 |
·进一步的工作 | 第111-113页 |
致谢 | 第113-114页 |
参考文献 | 第114-122页 |
附录 原型系统部分界面 | 第122-128页 |
攻读博士学位期间发表的论文_ | 第128页 |