摘要 | 第4-5页 |
abstract | 第5页 |
1 绪论 | 第8-13页 |
1.1 课题研究背景及意义 | 第8-9页 |
1.1.1 课题背景 | 第8-9页 |
1.1.2 研究意义 | 第9页 |
1.2 国内外研究动态及发展趋势 | 第9-12页 |
1.3 章节安排 | 第12-13页 |
2 关键技术介绍 | 第13-22页 |
2.1 赤道坐标系 | 第13页 |
2.2 天文索引方法 | 第13-17页 |
2.2.1 HTM(Hierarchical Triangular Mesh) | 第14-15页 |
2.2.2 Q3C(Quad Tree Cube) | 第15-16页 |
2.2.3 HEALPix(Hierarchical Equal Area iso Latitude Pixelisation) | 第16-17页 |
2.3 星表数据集介绍 | 第17-18页 |
2.3.1 SDSS(Sloan Digital Sky Survey)星表 | 第17-18页 |
2.3.2 2MASS(Two Micron All-Sky Survey)星表 | 第18页 |
2.4 分布式计算技术 | 第18-19页 |
2.5 Spark分布式内存计算框架 | 第19-21页 |
2.5.1 RDD弹性分布式数据集 | 第20页 |
2.5.2 Spark其他术语解释 | 第20-21页 |
2.6 HDFS分布式文件系统 | 第21页 |
2.7 本章小结 | 第21-22页 |
3 基于Spark的天区覆盖数据归档算法 | 第22-35页 |
3.1 算法的基本原理 | 第23-25页 |
3.2 算法设计与实现 | 第25-31页 |
3.2.1 第1阶段(数据预处理) | 第27-28页 |
3.2.2 第2阶段(数据聚合) | 第28-31页 |
3.3 实验与分析 | 第31-34页 |
3.3.1 数据集与集群配置情况 | 第31-32页 |
3.3.2 初始层级k对天区覆盖生成结果的影响 | 第32-33页 |
3.3.3 计算节点数对算法执行时间的影响 | 第33-34页 |
3.4 本章小结 | 第34-35页 |
4 基于Spark的大规模天文数据交叉证认算法 | 第35-43页 |
4.1 交叉证认 | 第35-36页 |
4.2 基于HEALPix的天区划分 | 第36-37页 |
4.3 边界漏源问题 | 第37页 |
4.4 算法设计与实现 | 第37-41页 |
4.4.1 负载均衡 | 第38-40页 |
4.4.2 Broadcast广播变量 | 第40页 |
4.4.3 序列化 | 第40-41页 |
4.5 实验与分析 | 第41-42页 |
4.6 本章小结 | 第42-43页 |
5 结论 | 第43-45页 |
5.1 全文总结 | 第43页 |
5.2 论文的创新点 | 第43页 |
5.3 论文的不足之处 | 第43-45页 |
6 展望 | 第45-46页 |
7 参考文献 | 第46-52页 |
8 攻读硕士学位期间论文发表情况 | 第52-53页 |
9 专利 | 第53-54页 |
10 致谢 | 第54页 |