论文创新点 | 第4-6页 |
目录 | 第6-12页 |
摘要 | 第12-14页 |
ABSTRACT | 第14-15页 |
1 绪论 | 第16-23页 |
1.1 研究的背景与意义 | 第16-17页 |
1.2 国内外研究方法与现状分析 | 第17-21页 |
1.2.1 概率模型国内外研究现状 | 第17-19页 |
1.2.2 视频对象处理国内外研究现状 | 第19-20页 |
1.2.3 研究中存在的问题及处理措施 | 第20-21页 |
1.3 论文结构框架及主要研究内容 | 第21-23页 |
2 概率模型及视频对象特征提取 | 第23-37页 |
2.1 概率模型基本理论 | 第23-27页 |
2.1.1 概率模型中的基本概念 | 第23-27页 |
2.1.1.1 随机矢量的分布函数及密度函数 | 第23-24页 |
2.1.1.2 期望矢量与离散度 | 第24-25页 |
2.1.1.3 特征函数及随机矢量变换 | 第25-27页 |
2.1.2 概率图形模型的基本类型 | 第27页 |
2.2 视频对象特征提取 | 第27-36页 |
2.2.1 视频对象颜色特征提取 | 第28-30页 |
2.2.1.1 颜色直方图 | 第28页 |
2.2.1.2 颜色相关图 | 第28-29页 |
2.2.1.3 颜色矩 | 第29页 |
2.2.1.4 颜色聚合矢量 | 第29-30页 |
2.2.2 视频对象形状特征提取 | 第30-33页 |
2.2.2.1 边界特征法 | 第30页 |
2.2.2.2 傅里叶形状描述符法 | 第30-31页 |
2.2.2.3 几何参数法 | 第31-32页 |
2.2.2.4 形状不变矩法 | 第32-33页 |
2.2.3 视频目标纹理特征提取 | 第33-36页 |
2.2.3.1 基于统计学的纹理特征提取 | 第33-35页 |
2.2.3.2 基于模型的纹理特征提取 | 第35页 |
2.2.3.3 基于结构的纹理特征提取 | 第35-36页 |
2.3 本章小节 | 第36-37页 |
3 基于高斯混合模型的视频对象分割 | 第37-58页 |
3.1 引言 | 第37-38页 |
3.2 概率混合模型 | 第38页 |
3.3 高斯混合模型的形式 | 第38-39页 |
3.3.1 单一高斯模型 | 第38-39页 |
3.3.2 高斯混合模型 | 第39页 |
3.4 高斯混合模型的参数估计 | 第39-45页 |
3.4.1 极大似然估计 | 第40页 |
3.4.2 期望最大化估计 | 第40-41页 |
3.4.3 最大惩罚似然参数估计 | 第41-43页 |
3.4.4 基于差分进化算法的参数估计 | 第43-45页 |
3.4.4.1 差分进化算法 | 第43-44页 |
3.4.4.2 参数估计算法流程 | 第44-45页 |
3.5 高斯混合模型选择 | 第45-52页 |
3.5.1 两种典型的模型选择准则 | 第45-46页 |
3.5.1.1 基于熵概念的 Akaike 信息准则 | 第45-46页 |
3.5.1.2 贝叶斯信息准则 | 第46页 |
3.5.2 基于非平稳度量的模型选择 | 第46-52页 |
3.5.2.1 数据流的信息结构及其香农信息熵 | 第47页 |
3.5.2.2 稳定集合的判断标准 | 第47-49页 |
3.5.2.3 数据流的初始划分 | 第49-50页 |
3.5.2.4 非平稳性度量的计算步骤 | 第50-52页 |
3.6 基于 GMM 的视频运动对象的分割 | 第52-53页 |
3.6.1 基于 GMM 的时间域背景提取 | 第52-53页 |
3.6.2 基于 GMM 的前景分割 | 第53页 |
3.6.3 基于空间属性的分割 | 第53页 |
3.7 实验仿真 | 第53-57页 |
3.7.1 GMM 参数估计的实验仿真 | 第53-54页 |
3.7.2 GMM 模型选择的实验仿真 | 第54-55页 |
3.7.3 视频对象分割实验仿真 | 第55-57页 |
3.8 本章小结 | 第57-58页 |
4 基于贝叶斯规则的视频对象分类 | 第58-77页 |
4.1 引言 | 第58页 |
4.2 类概率密度的非参数估计 | 第58-61页 |
4.2.1 核概率密度估计 | 第58-59页 |
4.2.2 核函数的选择 | 第59-60页 |
4.2.3 核窗宽的选择 | 第60-61页 |
4.3 基于最小错误率的贝叶斯分类 | 第61-69页 |
4.3.1 最小误判贝叶斯准则的判决 | 第61-62页 |
4.3.2 最小误判概率的 Chernoff 界限 | 第62-65页 |
4.3.3 多维正态分布的 Chernoff 上界 | 第65页 |
4.3.4 基于 Chernoff 上界的特征选择 | 第65-68页 |
4.3.5 实验仿真步骤及其结果分析 | 第68-69页 |
4.3.5.1 实验仿真步骤 | 第68页 |
4.3.5.2 实验结果及其分析 | 第68-69页 |
4.4 基于最少风险的贝叶斯分类 | 第69-76页 |
4.4.1 基于主成分分析的特征提取 | 第69-73页 |
4.4.1.1 对象特征主成分的几何解释 | 第70-71页 |
4.4.1.2 对象特征主成分的导出 | 第71-73页 |
4.4.2 基于最少风险的贝叶斯判决规则 | 第73-74页 |
4.4.3 实验步骤及仿真结果 | 第74-76页 |
4.4.3.1 实验步骤 | 第74-75页 |
4.4.3.2 实验结果及其分析 | 第75-76页 |
4.5 本章小结 | 第76-77页 |
5 基于小波域马尔科夫随机场的视频文本抽取与识别 | 第77-107页 |
5.1 引言 | 第77页 |
5.2 小波变换 | 第77-86页 |
5.2.1 窗函数 | 第77-78页 |
5.2.2 短时傅立叶变换 | 第78-80页 |
5.2.2.1 短时傅立叶变换 | 第78-79页 |
5.2.2.2 短时傅立叶变换的时频窗 | 第79-80页 |
5.2.3 连续小波变换 | 第80-82页 |
5.2.3.1 一维连续小波变换 | 第80-81页 |
5.2.3.2 二维连续小波变换 | 第81-82页 |
5.2.4 多分辩率分析 | 第82-84页 |
5.2.4.1 一维多分辩率分析 | 第82-83页 |
5.2.4.2 二维多分辩率分析 | 第83-84页 |
5.2.5 离散小波变换 | 第84-86页 |
5.2.5.1 一维离散小波变换 | 第84-85页 |
5.2.5.2 二维离散小波变换 | 第85-86页 |
5.3 马尔科夫随机场 | 第86-96页 |
5.3.1 马尔科夫随机场的基本概念 | 第86-90页 |
5.3.1.1 邻域系统和基团 | 第86-88页 |
5.3.1.2 马尔科夫随机场 | 第88页 |
5.3.1.3 吉普斯随机场 | 第88-89页 |
5.3.1.4 马尔科夫-吉普斯的等价性 | 第89-90页 |
5.3.2 常用马尔科夫模型 | 第90-94页 |
5.3.2.1 Ising(伊辛)模型 | 第90页 |
5.3.2.2 Potts(波茨)模型 | 第90-91页 |
5.3.2.3 Auto-model 模型 | 第91-92页 |
5.3.2.4 多级逻辑模型 | 第92-93页 |
5.3.2.5 多分辨率马尔科夫随机场模型 | 第93-94页 |
5.3.3 马尔科夫随机场参数估计 | 第94-96页 |
5.3.3.1 最大伪似然估计 | 第94-95页 |
5.3.3.2 最小二乘估计 | 第95-96页 |
5.4 基于多分辩率马尔科夫模型的视频文本的抽取 | 第96-102页 |
5.4.1 二维视频文本图像多分辨率分解 | 第96-97页 |
5.4.2 各小波尺度下的文本图像特征选择 | 第97-98页 |
5.4.3 小波域文本图像的建模 | 第98-99页 |
5.4.3.1 文本图像标记场的建模 | 第98-99页 |
5.4.3.2 文本图像特征场的建模 | 第99页 |
5.4.4 模型训练与推理 | 第99-102页 |
5.4.4.1 基于 MCMC 估计的模型训练 | 第99-101页 |
5.4.4.2 基于 MAP 的模型推理 | 第101页 |
5.4.4.3 视频文本抽取的实验步骤 | 第101-102页 |
5.5 基于支撑向量机的视频文本识别 | 第102-104页 |
5.5.1 基于多类问题的支撑向量机 | 第102-103页 |
5.5.2 视频文本识别实现步骤 | 第103-104页 |
5.6 实验仿真及结果分析 | 第104-106页 |
5.7 本章小节 | 第106-107页 |
6 动态贝叶斯网络框架下的粒子滤波视频跟踪 | 第107-118页 |
6.1 引言 | 第107页 |
6.2 状态空间模型 | 第107-108页 |
6.3 动态贝叶斯网络框架下的跟踪原理 | 第108-111页 |
6.3.1 Chapman-Kolmogorov 方程 | 第108页 |
6.3.2 蒙特卡罗积分 | 第108-109页 |
6.3.3 递归贝叶斯估计 | 第109-110页 |
6.3.4 目标状态估计法 | 第110-111页 |
6.4 传统的粒子滤波算法 | 第111-112页 |
6.5 融合多特征的退火核粒子滤波 | 第112-116页 |
6.5.1 退火核粒子滤波多特征的融合 | 第112-115页 |
6.5.1.1 颜色特征空间的转换 | 第112-113页 |
6.5.1.2 视频目标的多特征提取 | 第113-114页 |
6.5.1.3 基于巴氏系数的相似性度量 | 第114页 |
6.5.1.4 多特征融合策略 | 第114-115页 |
6.5.2 融合多特征的退火核粒子滤波算法 | 第115-116页 |
6.6 视频目标跟踪实验仿真 | 第116-117页 |
6.7 本章小节 | 第117-118页 |
7 基于隐马尔科夫模型的视频人体行为识别 | 第118-132页 |
7.1 引言 | 第118页 |
7.2 隐马尔科夫模型 | 第118-122页 |
7.2.1 隐马尔科夫模型的定义 | 第118-119页 |
7.2.2 隐马尔科夫模型的基本算法 | 第119-122页 |
7.2.2.1 前向-后向算法 | 第119-120页 |
7.2.2.2 Viterbi 算法 | 第120-121页 |
7.2.2.3 Baun-Welch 算法 | 第121-122页 |
7.3 视频对象网格特征的提取 | 第122-123页 |
7.4 视频对象特征的矢量量化 | 第123-126页 |
7.4.1 基于遗传算法的码书设计 | 第123-125页 |
7.4.1.1 编码形式的设计 | 第123-124页 |
7.4.1.2 算法设计步骤 | 第124-125页 |
7.4.2 二次型失真测度的码字搜索 | 第125-126页 |
7.5 用于人体行为理解的 DHHM 设计 | 第126-129页 |
7.5.1 模型拓扑 | 第126-127页 |
7.5.2 模型参数的训练 | 第127-128页 |
7.5.3 模型识别推理 | 第128-129页 |
7.6 实验仿真与分析 | 第129-130页 |
7.6.1 实验步骤 | 第129页 |
7.6.2 实验结果及分析 | 第129-130页 |
7.7 本章小节 | 第130-132页 |
8 总结与展望 | 第132-134页 |
8.1 全文总结 | 第132-133页 |
8.2 展望 | 第133-134页 |
参考文献 | 第134-145页 |
读博期间科研和论文情况 | 第145-146页 |
致谢 | 第146-148页 |
附件 | 第148-150页 |