基于模糊查询的大数据分析处理系统的研究与实现
| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 第1章 绪论 | 第11-17页 |
| 1.1 课题背景与研究意义 | 第11-12页 |
| 1.2 模糊查询和大数据分析处理研究情况 | 第12-15页 |
| 1.3 本文工作与贡献 | 第15页 |
| 1.4 论文结构 | 第15-16页 |
| 1.5 本章小结 | 第16-17页 |
| 第2章 在线聚集相关技术 | 第17-28页 |
| 2.1 在线聚集的基本描述 | 第17-20页 |
| 2.1.1 在线聚集基本原则 | 第18-19页 |
| 2.1.2 在线聚集的基本过程 | 第19-20页 |
| 2.2 统计分析模型 | 第20-23页 |
| 2.2.1 置信区间类型 | 第20-21页 |
| 2.2.2 置信区间的计算 | 第21-23页 |
| 2.3 多表聚集 | 第23-27页 |
| 2.4 本章小结 | 第27-28页 |
| 第3章 基于模糊查询的大数据分析处理系统架构 | 第28-36页 |
| 3.1 随机混淆模块 | 第29-30页 |
| 3.2 用户查询模块 | 第30-32页 |
| 3.3 样本管理模块 | 第32-34页 |
| 3.4 查询引擎模块 | 第34页 |
| 3.5 统计估计模块 | 第34-35页 |
| 3.6 本章小结 | 第35-36页 |
| 第4章 样本和中间结果管理 | 第36-51页 |
| 4.1 树节点介绍 | 第36-37页 |
| 4.2 分裂方式 | 第37-38页 |
| 4.3 节点分裂 | 第38-43页 |
| 4.3.1 按离散型维度分裂 | 第38-41页 |
| 4.3.2 按连续型维度分裂 | 第41-43页 |
| 4.4 节点合并 | 第43-45页 |
| 4.5 层次转换 | 第45-49页 |
| 4.6 样本存储 | 第49-50页 |
| 4.7 本章小结 | 第50-51页 |
| 第5章 查询引擎和统计估计量 | 第51-59页 |
| 5.1 查询引擎 | 第51-54页 |
| 5.1.1 在样本管理树的查询过程 | 第51-53页 |
| 5.1.2 在数据源中查询 | 第53-54页 |
| 5.2 统计估计量 | 第54-58页 |
| 5.2.1 叶子节点的统计估计量 | 第54-56页 |
| 5.2.2 统计估计量的合并 | 第56-58页 |
| 5.3 本章小结 | 第58-59页 |
| 第6章 实验结果及分析 | 第59-70页 |
| 6.1 实验配置 | 第59-62页 |
| 6.1.1 运行环境 | 第59页 |
| 6.1.2 实验数据 | 第59-60页 |
| 6.1.3 实验设置 | 第60-61页 |
| 6.1.4 用户界面 | 第61-62页 |
| 6.2 实验结果与分析 | 第62-68页 |
| 6.2.1 数据集大小对实验结果的影响 | 第62-64页 |
| 6.2.2 置信度和误差界限对查询时间的影响 | 第64-67页 |
| 6.2.3 聚合结果的准确性 | 第67-68页 |
| 6.3 本章小结 | 第68-70页 |
| 第7章 总结与展望 | 第70-72页 |
| 7.1 本文主要工作与贡献 | 第70页 |
| 7.2 未来研究工作展望 | 第70-72页 |
| 参考文献 | 第72-75页 |
| 攻读硕士学位期间主要的研究成果 | 第75-76页 |
| 致谢 | 第76页 |