摘要 | 第3-5页 |
Abstract | 第5-6页 |
主要符号对照表 | 第10-11页 |
第1章 绪论 | 第11-22页 |
1.1 引言 | 第11页 |
1.2 研究背景与意义 | 第11-13页 |
1.3 相似性搜索的发展 | 第13-16页 |
1.3.1 从最近邻到近似最近邻查询 | 第13-14页 |
1.3.2 从低维到高维数据处理 | 第14-15页 |
1.3.3 从串行到并行搜索 | 第15-16页 |
1.4 面临的挑战 | 第16-18页 |
1.5 研究内容与主要贡献 | 第18-21页 |
1.6 论文组织结构 | 第21-22页 |
第2章 理论与相关研究工作 | 第22-32页 |
2.1 相似性搜索定义 | 第22页 |
2.2 常用相似性度量方法 | 第22-24页 |
2.2.1 闵可夫斯基距离 | 第23页 |
2.2.2 马氏距离 | 第23页 |
2.2.3 余弦相似度 | 第23-24页 |
2.2.4 汉明距离 | 第24页 |
2.2.5 杰卡德相似系数 | 第24页 |
2.3 相似性搜索算法的评价指标 | 第24-26页 |
2.3.1 准确性 | 第24-25页 |
2.3.2 时间效率 | 第25页 |
2.3.3 空间效率 | 第25页 |
2.3.4 并行能力 | 第25-26页 |
2.4 相似性搜索算法的分类 | 第26-27页 |
2.4.1 基于选择策略的相似性搜索算法 | 第26页 |
2.4.2 基于过滤策略的相似性搜索算法 | 第26-27页 |
2.5 相似性搜索研究现状 | 第27-31页 |
2.5.1 基于分支界定的相似性搜索算法及优化 | 第27-28页 |
2.5.2 基于空间映射的相似性搜索算法及优化 | 第28-29页 |
2.5.3 基于子空间聚类的相似性搜索算法及优化 | 第29-31页 |
2.5.4 基于图形处理器的相似性搜索算法及优化 | 第31页 |
2.6 本章小结 | 第31-32页 |
第3章 基于子空间聚类相似性搜索算法的最优子空间构建方法 | 第32-59页 |
3.1 本章概述 | 第32-34页 |
3.2 子空间聚类思想 | 第34-39页 |
3.2.1 子空间聚类实现步骤 | 第34-36页 |
3.2.2 子空间聚类的局限性 | 第36-39页 |
3.3 子空间构建方案设计及观察 | 第39-49页 |
3.3.1 子空间构建方案 | 第39-42页 |
3.3.2 测试环境搭建 | 第42-43页 |
3.3.3 观察1:不同的构建方案对性能影响微乎其微 | 第43-46页 |
3.3.4 观察2:不同的构建方案对精度影响较大 | 第46页 |
3.3.5 观察3:子空间内维度的方差分布是精度的主要影响因素 | 第46-49页 |
3.4 最优子空间构建方法 | 第49-52页 |
3.4.1 采样方差 | 第49页 |
3.4.2 创建索引 | 第49-51页 |
3.4.3 生成子空间 | 第51-52页 |
3.5 实验结果 | 第52-58页 |
3.5.1 实验环境搭建 | 第52页 |
3.5.2 最优子空间构建开销 | 第52-53页 |
3.5.3 基于最优子空间的估距时间 | 第53页 |
3.5.4 基于最优子空间的估距误差 | 第53-55页 |
3.5.5 基于最优子空间的搜索精度 | 第55-58页 |
3.6 本章小结 | 第58-59页 |
第4章 PCAF: 一种高可扩展性高精度并行相似性搜索算法 | 第59-101页 |
4.1 本章概述 | 第59-61页 |
4.2 算法思想 | 第61-66页 |
4.3 算法设计 | 第66-69页 |
4.3.1 基于主成分分析的排名预测 | 第66-67页 |
4.3.2 双堆数据过滤机制 | 第67-68页 |
4.3.3 细粒度的数据并行策略 | 第68-69页 |
4.3.4 空间和时间复杂度分析 | 第69页 |
4.4 实验结果 | 第69-100页 |
4.4.1 实验环境搭建 | 第70-73页 |
4.4.2 对比实验结果 | 第73-88页 |
4.4.3 参数评估及理论分析 | 第88-100页 |
4.5 本章小结 | 第100-101页 |
第5章 相似性搜索算法的执行优化框架 | 第101-124页 |
5.1 本章概述 | 第101-103页 |
5.2 相似性搜索算法在应用中的优化问题 | 第103页 |
5.3 执行优化思路及步骤 | 第103-105页 |
5.4 执行优化框架设计 | 第105-110页 |
5.4.1 需求配置模块 | 第105-107页 |
5.4.2 执行模块 | 第107-109页 |
5.4.3 结果输出模块 | 第109-110页 |
5.5 执行优化框架的适用性 | 第110页 |
5.6 PCAFfee执行优化系统的实现与配置 | 第110-114页 |
5.6.1 硬件检测模块配置 | 第110-111页 |
5.6.2 调参决策模块的实现 | 第111-114页 |
5.7 PCAFfee系统测试结果 | 第114-119页 |
5.7.1 测试环境搭建 | 第114-115页 |
5.7.2 测试案例设计 | 第115-116页 |
5.7.3 执行优化效果 | 第116-119页 |
5.8 实例研究:真实大数据应用案例GIST1M的执行优化 | 第119-123页 |
5.8.1 执行优化相关配置 | 第119页 |
5.8.2 执行优化开销 | 第119-121页 |
5.8.3 调优后的精度与性能提升 | 第121页 |
5.8.4 调优后各算法性能对比 | 第121-123页 |
5.9 本章小结 | 第123-124页 |
第6章 总结及展望 | 第124-127页 |
6.1 研究工作总结 | 第124-126页 |
6.2 未来工作展望 | 第126-127页 |
参考文献 | 第127-135页 |
致谢 | 第135-137页 |
个人简历、在学期间发表的学术论文与研究成果 | 第137-138页 |