基于模糊查询的大数据分析处理系统的研究与实现
摘要 | 第4-5页 |
Abstract | 第5页 |
第1章 绪论 | 第11-17页 |
1.1 课题背景与研究意义 | 第11-12页 |
1.2 模糊查询和大数据分析处理研究情况 | 第12-15页 |
1.3 本文工作与贡献 | 第15页 |
1.4 论文结构 | 第15-16页 |
1.5 本章小结 | 第16-17页 |
第2章 在线聚集相关技术 | 第17-28页 |
2.1 在线聚集的基本描述 | 第17-20页 |
2.1.1 在线聚集基本原则 | 第18-19页 |
2.1.2 在线聚集的基本过程 | 第19-20页 |
2.2 统计分析模型 | 第20-23页 |
2.2.1 置信区间类型 | 第20-21页 |
2.2.2 置信区间的计算 | 第21-23页 |
2.3 多表聚集 | 第23-27页 |
2.4 本章小结 | 第27-28页 |
第3章 基于模糊查询的大数据分析处理系统架构 | 第28-36页 |
3.1 随机混淆模块 | 第29-30页 |
3.2 用户查询模块 | 第30-32页 |
3.3 样本管理模块 | 第32-34页 |
3.4 查询引擎模块 | 第34页 |
3.5 统计估计模块 | 第34-35页 |
3.6 本章小结 | 第35-36页 |
第4章 样本和中间结果管理 | 第36-51页 |
4.1 树节点介绍 | 第36-37页 |
4.2 分裂方式 | 第37-38页 |
4.3 节点分裂 | 第38-43页 |
4.3.1 按离散型维度分裂 | 第38-41页 |
4.3.2 按连续型维度分裂 | 第41-43页 |
4.4 节点合并 | 第43-45页 |
4.5 层次转换 | 第45-49页 |
4.6 样本存储 | 第49-50页 |
4.7 本章小结 | 第50-51页 |
第5章 查询引擎和统计估计量 | 第51-59页 |
5.1 查询引擎 | 第51-54页 |
5.1.1 在样本管理树的查询过程 | 第51-53页 |
5.1.2 在数据源中查询 | 第53-54页 |
5.2 统计估计量 | 第54-58页 |
5.2.1 叶子节点的统计估计量 | 第54-56页 |
5.2.2 统计估计量的合并 | 第56-58页 |
5.3 本章小结 | 第58-59页 |
第6章 实验结果及分析 | 第59-70页 |
6.1 实验配置 | 第59-62页 |
6.1.1 运行环境 | 第59页 |
6.1.2 实验数据 | 第59-60页 |
6.1.3 实验设置 | 第60-61页 |
6.1.4 用户界面 | 第61-62页 |
6.2 实验结果与分析 | 第62-68页 |
6.2.1 数据集大小对实验结果的影响 | 第62-64页 |
6.2.2 置信度和误差界限对查询时间的影响 | 第64-67页 |
6.2.3 聚合结果的准确性 | 第67-68页 |
6.3 本章小结 | 第68-70页 |
第7章 总结与展望 | 第70-72页 |
7.1 本文主要工作与贡献 | 第70页 |
7.2 未来研究工作展望 | 第70-72页 |
参考文献 | 第72-75页 |
攻读硕士学位期间主要的研究成果 | 第75-76页 |
致谢 | 第76页 |