基于统计学的视频语义分析与提取技术研究
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-9页 |
| 目录 | 第9-12页 |
| 图清单 | 第12-14页 |
| 表清单 | 第14-15页 |
| 缩略词及中英文词汇对照 | 第15-18页 |
| 1 绪论 | 第18-34页 |
| ·研究背景 | 第18-21页 |
| ·非语义视频内容分析 | 第18-19页 |
| ·视频语义分析 | 第19-21页 |
| ·国内外研究现状 | 第21-30页 |
| ·视频语义内容分析 | 第21-23页 |
| ·语义分析方法对比与总结 | 第23-29页 |
| ·相关标准 | 第29-30页 |
| ·课题来源 | 第30页 |
| ·本文主要工作及创新点 | 第30-32页 |
| ·本文主要工作 | 第30-31页 |
| ·本文创新点 | 第31-32页 |
| ·论文组织结构 | 第32-33页 |
| ·本章小结 | 第33-34页 |
| 2 视频语义内容分析 | 第34-59页 |
| ·引言 | 第34页 |
| ·镜头边界检测与分割 | 第34-44页 |
| ·基于统计分布的渐变镜头检测与分割 | 第34-35页 |
| ·特征量提取与测量准则建立 | 第35-36页 |
| ·渐变镜头边界检测 | 第36-40页 |
| ·实验与分析 | 第40-44页 |
| ·视频运动对象分割 | 第44-48页 |
| ·全局运动计算与补偿 | 第45-46页 |
| ·对象分割 | 第46-47页 |
| ·实例实验 | 第47-48页 |
| ·低层特征抽取 | 第48-58页 |
| ·静态视觉特征 | 第48-50页 |
| ·运动特征 | 第50-53页 |
| ·音频特征 | 第53页 |
| ·实验与分析 | 第53-58页 |
| ·本章小结 | 第58-59页 |
| 3 视觉语义分析与理解 | 第59-83页 |
| ·引言 | 第59页 |
| ·基于时空注意力模型的基本视觉语义分析 | 第59-68页 |
| ·注意力机制选择显著区域 | 第60-61页 |
| ·视觉基本语义识别 | 第61-62页 |
| ·视觉基本语义分类识别的特征选择算法 | 第62-66页 |
| ·实验与分析 | 第66-68页 |
| ·具有多峰正态分布属性的基本视觉语义识别 | 第68-73页 |
| ·原理与解决思路 | 第68-69页 |
| ·定步长组合划分方法 | 第69-71页 |
| ·实验与分析 | 第71-73页 |
| ·高层视觉语义分析 | 第73-81页 |
| ·高层视觉语义模型构建 | 第74-75页 |
| ·关键帧策略与时间语义语境约束线索 | 第75-76页 |
| ·模型参数估计 | 第76-78页 |
| ·时间语义的可观察符号 | 第78-80页 |
| ·实验与分析 | 第80-81页 |
| ·本章小结 | 第81-83页 |
| 4 音频语义分析与理解 | 第83-102页 |
| ·引言 | 第83页 |
| ·基本声音语义分析 | 第83-93页 |
| ·基本声音语义模型 | 第83-84页 |
| ·基本声音语义识别系统模型 | 第84页 |
| ·谱特征提取 | 第84-88页 |
| ·基本声音语义模型训练 | 第88-89页 |
| ·基本声音语义识别 | 第89-90页 |
| ·实验与分析 | 第90-93页 |
| ·音频高层语义分析 | 第93-101页 |
| ·音频高层语义建模 | 第94-96页 |
| ·音频高层语义提取 | 第96-99页 |
| ·实验与分析 | 第99-101页 |
| ·本章小结 | 第101-102页 |
| 5 视频语义分析两级多模式信息融合 | 第102-110页 |
| ·引言 | 第102页 |
| ·模式划分与融合原理 | 第102-104页 |
| ·融合模型与融合算法 | 第104-107页 |
| ·实验与分析 | 第107-109页 |
| ·本章小结 | 第109-110页 |
| 6 结论与展望 | 第110-113页 |
| ·总结 | 第110-111页 |
| ·进一步的工作 | 第111-113页 |
| 致谢 | 第113-114页 |
| 参考文献 | 第114-122页 |
| 附录 原型系统部分界面 | 第122-128页 |
| 攻读博士学位期间发表的论文_ | 第128页 |