ETL过程改进的研究
| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 第一章 引言 | 第7-10页 |
| ·研究背景 | 第7-8页 |
| ·研究现状 | 第8页 |
| ·本文的组织结构 | 第8-10页 |
| 第二章 SEU_ETL的功能和框架 | 第10-13页 |
| ·统一数据模型 | 第10-11页 |
| ·ETL 过程的逻辑描述与执行 | 第11-12页 |
| ·元数据管理 | 第12-13页 |
| 第三章 ETL过程中的增量数据源 | 第13-23页 |
| ·增量数据的捕获 | 第13-15页 |
| ·级联触发的判断 | 第15-20页 |
| ·触发器结构分析 | 第15页 |
| ·触发器级联触发的检测 | 第15-16页 |
| ·触发器筛选规则 | 第16页 |
| ·自动搜索级联触发环 | 第16-20页 |
| ·增量数据源在ETL 工具中的管理和展示 | 第20-22页 |
| ·小结 | 第22-23页 |
| 第四章 增量ETL过程 | 第23-28页 |
| ·增量数据的预处理 | 第23-24页 |
| ·增量刷新的异常 | 第24-26页 |
| ·增量ETL 过程的处理 | 第26-27页 |
| ·事实表增量更新 | 第26页 |
| ·连接操作的增量更新 | 第26-27页 |
| ·聚集运算的增量更新 | 第27页 |
| ·小结 | 第27-28页 |
| 第五章 ETL过程的并行拓展 | 第28-40页 |
| ·域分解 | 第28-32页 |
| ·逻辑等价性 | 第28-29页 |
| ·均匀划分原则 | 第29-30页 |
| ·域分解实例 | 第30-32页 |
| ·基于划分的SPMD 并行 | 第32-33页 |
| ·SPMD 模型 | 第32页 |
| ·SPMD 并行的性能分析 | 第32-33页 |
| ·流水线并行 | 第33-38页 |
| ·流水化ETL 过程模型 | 第34-35页 |
| ·流水化ETL 过程执行性能分析 | 第35-36页 |
| ·流水化的分片策略 | 第36-37页 |
| ·流水过程的优化 | 第37-38页 |
| ·SEU_ETL 的并行程序设计框架 | 第38-39页 |
| ·小结 | 第39-40页 |
| 第六章 总结和展望 | 第40-41页 |
| 致谢 | 第41-42页 |
| 参考文献 | 第42页 |