基于模糊查询的大数据分析处理系统的研究与实现

摘要	第4-5页
Abstract	第5页
第1章绪论	第11-17页
1.1 课题背景与研究意义	第11-12页
1.2 模糊查询和大数据分析处理研究情况	第12-15页
1.3 本文工作与贡献	第15页
1.4 论文结构	第15-16页
1.5 本章小结	第16-17页
第2章在线聚集相关技术	第17-28页
2.1 在线聚集的基本描述	第17-20页
2.1.1 在线聚集基本原则	第18-19页
2.1.2 在线聚集的基本过程	第19-20页
2.2 统计分析模型	第20-23页
2.2.1 置信区间类型	第20-21页
2.2.2 置信区间的计算	第21-23页
2.3 多表聚集	第23-27页
2.4 本章小结	第27-28页
第3章基于模糊查询的大数据分析处理系统架构	第28-36页
3.1 随机混淆模块	第29-30页
3.2 用户查询模块	第30-32页
3.3 样本管理模块	第32-34页
3.4 查询引擎模块	第34页
3.5 统计估计模块	第34-35页
3.6 本章小结	第35-36页
第4章样本和中间结果管理	第36-51页
4.1 树节点介绍	第36-37页
4.2 分裂方式	第37-38页
4.3 节点分裂	第38-43页
4.3.1 按离散型维度分裂	第38-41页
4.3.2 按连续型维度分裂	第41-43页
4.4 节点合并	第43-45页
4.5 层次转换	第45-49页
4.6 样本存储	第49-50页
4.7 本章小结	第50-51页
第5章查询引擎和统计估计量	第51-59页
5.1 查询引擎	第51-54页
5.1.1 在样本管理树的查询过程	第51-53页
5.1.2 在数据源中查询	第53-54页
5.2 统计估计量	第54-58页
5.2.1 叶子节点的统计估计量	第54-56页
5.2.2 统计估计量的合并	第56-58页
5.3 本章小结	第58-59页
第6章实验结果及分析	第59-70页
6.1 实验配置	第59-62页
6.1.1 运行环境	第59页
6.1.2 实验数据	第59-60页
6.1.3 实验设置	第60-61页
6.1.4 用户界面	第61-62页
6.2 实验结果与分析	第62-68页
6.2.1 数据集大小对实验结果的影响	第62-64页
6.2.2 置信度和误差界限对查询时间的影响	第64-67页
6.2.3 聚合结果的准确性	第67-68页
6.3 本章小结	第68-70页
第7章总结与展望	第70-72页
7.1 本文主要工作与贡献	第70页
7.2 未来研究工作展望	第70-72页
参考文献	第72-75页
攻读硕士学位期间主要的研究成果	第75-76页
致谢	第76页