摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 绪论 | 第12-18页 |
1.1 论文研究背景 | 第12-14页 |
1.1.1 MUSER项目简介 | 第12-13页 |
1.1.2 MUSER高性能计算能力需求 | 第13-14页 |
1.2 国内外研究现状 | 第14-15页 |
1.3 论文研究的目的与意义 | 第15页 |
1.4 论文的主要研究工作 | 第15-16页 |
1.4.1 论文的研究内容 | 第15页 |
1.4.2 论文的组织结构 | 第15-16页 |
1.5 本章小结 | 第16-18页 |
第二章 流式计算研究 | 第18-32页 |
2.1 流式计算相关技术综述 | 第18-21页 |
2.1.1 流式计算概述 | 第18-19页 |
2.1.2 流式大数据的定义及特点 | 第19-20页 |
2.1.3 流式计算的应用场景及价值 | 第20-21页 |
2.1.4 当前主流数据流计算环境 | 第21页 |
2.2 分布式流式计算系统架构 | 第21-22页 |
2.2.1 主从式架构 | 第21-22页 |
2.2.2 对称式架构 | 第22页 |
2.3 流式计算关键技术 | 第22-23页 |
2.3.1 数据传输 | 第22页 |
2.3.2 高可用技术 | 第22-23页 |
2.3.3 编程接口 | 第23页 |
2.3.4 动态负载均衡 | 第23页 |
2.3.5 其他关键技术 | 第23页 |
2.4 流式计算平台的对比分析与选择 | 第23-28页 |
2.4.1 Storm | 第24页 |
2.4.2 S4 | 第24页 |
2.4.3 StreamBase | 第24-25页 |
2.4.4 Spark Streaming | 第25页 |
2.4.5 对比分析 | 第25-27页 |
2.4.6 流式计算平台选择 | 第27-28页 |
2.5 现存的问题和技术挑战 | 第28-30页 |
2.5.1 系统可伸缩性 | 第28-29页 |
2.5.2 系统的容错性 | 第29页 |
2.5.3 状态的一致性 | 第29页 |
2.5.4 系统的负载均衡 | 第29页 |
2.5.5 数据吞吐量 | 第29-30页 |
2.6 本章小结 | 第30-32页 |
第三章 MUSER实时数据处理分析与PIPELINE设计 | 第32-42页 |
3.1 数据处理需求分析 | 第32-34页 |
3.2 数据处理PIPELINE整体设计 | 第34-35页 |
3.3 工作流标签设计 | 第35-36页 |
3.4 各模块中的关键技术 | 第36-38页 |
3.4.1 数据采集模块设计 | 第36-37页 |
3.4.2 数据归档和高性能索引 | 第37页 |
3.4.3 延迟补偿和条纹停止 | 第37页 |
3.4.4 星表校准 | 第37-38页 |
3.4.5 数据标记 | 第38页 |
3.4.6 图像洁化 | 第38页 |
3.5 数据处理PIPELINE硬件部署 | 第38-40页 |
3.6 本章小结 | 第40-42页 |
第四章 MUSER-PIPELINE的实现中的关键技术 | 第42-54页 |
4.1 Spark Streaming中关键技术在MUSER中的应用 | 第42-44页 |
4.1.1 弹性分布式数据集合与数据格式扩展 | 第42-43页 |
4.1.2 持久化 | 第43-44页 |
4.1.3 混合计算节点的实现 | 第44页 |
4.2 分布式UVFITS文件生成 | 第44-47页 |
4.3 分布式实时存储环境下的FITS数据一致性 | 第47-52页 |
4.3.1 一致性需求、不一致原因及状态分析 | 第47-49页 |
4.3.2 一致性解决方案 | 第49-51页 |
4.3.3 超时时间选择 | 第51-52页 |
4.4 本章小结 | 第52-54页 |
第五章 MUSER-PIPELINE部分实验结果 | 第54-58页 |
5.1 实验硬件环境 | 第54-55页 |
5.2 基于Spark Streaming的UVFITS合成实验 | 第55页 |
5.3 FITS一致性实验 | 第55-56页 |
5.4 本章小结 | 第56-58页 |
第六章 总结与未来工作 | 第58-60页 |
6.1 总结 | 第58-59页 |
6.2 未来工作 | 第59-60页 |
致谢 | 第60-62页 |
参考文献 | 第62-68页 |
附录A (攻读学位期间发表论文目录) | 第68-70页 |
附录B (攻读学位其间参与科研项目) | 第70页 |