摘要 | 第4-6页 |
abstract | 第6-7页 |
第1章 绪论 | 第12-28页 |
1.1 课题研究背景及意义 | 第12-14页 |
1.2 语义SLAM系统关键技术综述 | 第14-24页 |
1.2.1 同时定位与建图技术 | 第14-18页 |
1.2.2 语义分割技术 | 第18-22页 |
1.2.3 三维语义表面重建技术 | 第22-24页 |
1.3 场景三维语义表面重建研究思路 | 第24-25页 |
1.4 本文的研究内容和章节安排 | 第25-28页 |
第2章 基于特征点匹配和光流跟踪的相机跟踪方法 | 第28-58页 |
2.1 引言 | 第28页 |
2.2 基于特征点和图优化的视觉SLAM系统原理 | 第28-31页 |
2.3 相机模型 | 第31-33页 |
2.3.1 相机内参 | 第31-32页 |
2.3.2 相机外参 | 第32-33页 |
2.4 特征点 | 第33-37页 |
2.5 稀疏SLAM系统结构 | 第37-39页 |
2.5.1 系统概述 | 第37-38页 |
2.5.2 共视图(Covisibility Graph) | 第38-39页 |
2.5.3 本质图(Essential Graph) | 第39页 |
2.6 跟踪线程 | 第39-43页 |
2.6.1 特征点跟踪和匹配 | 第39-41页 |
2.6.2 位姿估计 | 第41-42页 |
2.6.3 关键帧选择 | 第42-43页 |
2.7 局部构图线程 | 第43-44页 |
2.7.1 局部地图管理 | 第43页 |
2.7.2 局部地图优化(LocalBA) | 第43-44页 |
2.8 回环检测与校正线程 | 第44-47页 |
2.8.1 视觉词典 | 第44-45页 |
2.8.2 回环检测 | 第45页 |
2.8.3 回环校正 | 第45-47页 |
2.9 实验结果分析 | 第47-56页 |
2.9.1 特征点性能对比实验 | 第47-50页 |
2.9.2 共视图和本质图实验 | 第50-51页 |
2.9.3 各种匹配模型对比实验 | 第51-56页 |
2.9.4 回环优化实验 | 第56页 |
2.10 本章总结 | 第56-58页 |
第3章 基于空间金字塔和RGB-D多级融合的语义分割网络 | 第58-88页 |
3.1 引言 | 第58页 |
3.2 深度卷积神经网络 | 第58-60页 |
3.2.1 深度学习网络概述 | 第58-59页 |
3.2.2 深度卷积神经网络 | 第59-60页 |
3.3 卷积图像分类网络 | 第60-67页 |
3.3.1 Alexnet | 第61-62页 |
3.3.2 VGG-Net | 第62-63页 |
3.3.3 Inception | 第63-65页 |
3.3.4 ResNet | 第65-67页 |
3.4 语义分割网络 | 第67-73页 |
3.4.1 全卷积神经网络(FCN) | 第67-68页 |
3.4.2 编码-解码卷积神经网络 | 第68-69页 |
3.4.3 DeepLab网络结构 | 第69-73页 |
3.5 FuseASPS语义分割网络 | 第73-76页 |
3.5.1 空间金字塔模块(ASPS) | 第74-75页 |
3.5.2 RGB-D特征信息多级融合 | 第75-76页 |
3.6 实验结果分析 | 第76-87页 |
3.6.1 训练数据集 | 第76-77页 |
3.6.2 带权重的损失函数 | 第77-78页 |
3.6.3 评价指标 | 第78页 |
3.6.4 网络训练 | 第78-79页 |
3.6.5 卷积神经网络测试 | 第79-87页 |
3.7 本章小结 | 第87-88页 |
第4章 基于TSDF的大尺度场景三维语义地图重建 | 第88-110页 |
4.1 引言 | 第88页 |
4.2 语义SLAM系统结构 | 第88-89页 |
4.3 深度图像预处理 | 第89-92页 |
4.3.1 高斯滤波 | 第90页 |
4.3.2 中值滤波 | 第90页 |
4.3.3 均值滤波 | 第90-91页 |
4.3.4 双边滤波 | 第91-92页 |
4.4 三维语义地图创建 | 第92-96页 |
4.4.1 三维语义体积元表示方法 | 第92-93页 |
4.4.2 三维语义体积元更新方法 | 第93-95页 |
4.4.3 三维表面生成 | 第95-96页 |
4.5 大尺度三维模型构建 | 第96-97页 |
4.6 三维语义表面形变处理 | 第97-99页 |
4.6.1 形变地图构建 | 第97-98页 |
4.6.2 三维表面点云优化 | 第98-99页 |
4.7 实验结果分析 | 第99-107页 |
4.7.1 深度图的预处理实验 | 第99-101页 |
4.7.3 三维表面生成实验 | 第101-102页 |
4.7.4 大尺度场景重建实验 | 第102-104页 |
4.7.5 三维表面形变实验 | 第104页 |
4.7.6 三维语义表面投射实验 | 第104-107页 |
4.8 本章总结 | 第107-110页 |
第5章 基于深度学习的语义SLAM系统实验平台 | 第110-124页 |
5.1 引言 | 第110页 |
5.2 系统整体设计框架 | 第110-111页 |
5.3 Kinect相机标定 | 第111-115页 |
5.3.1 Kinect相机 | 第111-112页 |
5.3.2 RGB-D相机模型 | 第112页 |
5.3.3 图像畸变 | 第112-113页 |
5.3.4 Kinect相机标定实验 | 第113-115页 |
5.4 语义SLAM系统优化和实时性实验 | 第115-117页 |
5.4.1 系统实时性设计 | 第115-116页 |
5.4.2 系统实时性测试 | 第116-117页 |
5.5 系统相机位姿跟踪性能测试 | 第117-118页 |
5.6 语义SLAM系统对于单帧图像语义分割的改进 | 第118-121页 |
5.6.1 单帧图像语义分割结果的改进 | 第118-119页 |
5.6.2 视频序列图像语义分割稳定性的改进 | 第119-121页 |
5.7 大尺度场景的三维语义表面重建实验 | 第121-123页 |
5.8 本章总结 | 第123-124页 |
第6章 总结与展望 | 第124-127页 |
6.1 总结 | 第124-125页 |
6.2 展望 | 第125-127页 |
参考文献 | 第127-132页 |
致谢 | 第132-134页 |
作者简历及攻读学位期间发表的学术论文与研究成果 | 第134页 |