ETL过程改进的研究
摘要 | 第1-5页 |
Abstract | 第5-7页 |
第一章 引言 | 第7-10页 |
·研究背景 | 第7-8页 |
·研究现状 | 第8页 |
·本文的组织结构 | 第8-10页 |
第二章 SEU_ETL的功能和框架 | 第10-13页 |
·统一数据模型 | 第10-11页 |
·ETL 过程的逻辑描述与执行 | 第11-12页 |
·元数据管理 | 第12-13页 |
第三章 ETL过程中的增量数据源 | 第13-23页 |
·增量数据的捕获 | 第13-15页 |
·级联触发的判断 | 第15-20页 |
·触发器结构分析 | 第15页 |
·触发器级联触发的检测 | 第15-16页 |
·触发器筛选规则 | 第16页 |
·自动搜索级联触发环 | 第16-20页 |
·增量数据源在ETL 工具中的管理和展示 | 第20-22页 |
·小结 | 第22-23页 |
第四章 增量ETL过程 | 第23-28页 |
·增量数据的预处理 | 第23-24页 |
·增量刷新的异常 | 第24-26页 |
·增量ETL 过程的处理 | 第26-27页 |
·事实表增量更新 | 第26页 |
·连接操作的增量更新 | 第26-27页 |
·聚集运算的增量更新 | 第27页 |
·小结 | 第27-28页 |
第五章 ETL过程的并行拓展 | 第28-40页 |
·域分解 | 第28-32页 |
·逻辑等价性 | 第28-29页 |
·均匀划分原则 | 第29-30页 |
·域分解实例 | 第30-32页 |
·基于划分的SPMD 并行 | 第32-33页 |
·SPMD 模型 | 第32页 |
·SPMD 并行的性能分析 | 第32-33页 |
·流水线并行 | 第33-38页 |
·流水化ETL 过程模型 | 第34-35页 |
·流水化ETL 过程执行性能分析 | 第35-36页 |
·流水化的分片策略 | 第36-37页 |
·流水过程的优化 | 第37-38页 |
·SEU_ETL 的并行程序设计框架 | 第38-39页 |
·小结 | 第39-40页 |
第六章 总结和展望 | 第40-41页 |
致谢 | 第41-42页 |
参考文献 | 第42页 |