通用ETL工具的研究与设计
摘要 | 第6-7页 |
Abstract | 第7页 |
第一章 绪论 | 第8-13页 |
1.1 研究背景和意义 | 第8-9页 |
1.2 ETL技术简介 | 第9-11页 |
1.2.1 ETL的一般模型 | 第9页 |
1.2.2 ETL的重要性 | 第9-10页 |
1.2.3 ETL工具的功能 | 第10-11页 |
1.3 本文研究工作 | 第11页 |
1.4 论文组织 | 第11-13页 |
第二章 相关技术与国内外研究现状 | 第13-23页 |
2.1 数据仓库 | 第13-15页 |
2.1.1 数据仓库的概念和特征 | 第13页 |
2.1.2 数据仓库的发展历程 | 第13-14页 |
2.1.3 数据仓库的重要性 | 第14-15页 |
2.2 元数据 | 第15-17页 |
2.2.1 元数据概述 | 第15页 |
2.2.2 ETL元数据 | 第15-17页 |
2.2.3 元数据的重要性 | 第17页 |
2.3 数据质量和数据清洁 | 第17-19页 |
2.3.1 数据质量 | 第17-18页 |
2.3.2 数据清洁 | 第18-19页 |
2.4 JDBC技术 | 第19-20页 |
2.5 XML技术 | 第20页 |
2.6 ETL产品概述 | 第20-22页 |
2.7 小结 | 第22-23页 |
第三章 通用ETL工具的分析和研究 | 第23-31页 |
3.1 异构数据源分析研究 | 第23-24页 |
3.1.1 数据源的分类 | 第23页 |
3.1.2 数据类型的转换 | 第23-24页 |
3.1.3 海量数据的读取 | 第24页 |
3.2 元数据分析研究 | 第24-25页 |
3.3 可视化分析研究 | 第25-26页 |
3.4 数据转换功能分析研究 | 第26-28页 |
3.5 管理和调度分析研究 | 第28-29页 |
3.5.1 ETL作业管理和调度 | 第28-29页 |
3.5.2 ETL节点调度 | 第29页 |
3.6 可扩展性分析研究 | 第29-30页 |
3.6.1 数据源的可扩展性 | 第29-30页 |
3.6.2 转换组件的可扩展性 | 第30页 |
3.7 小结 | 第30-31页 |
第四章 通用ETL工具的设计 | 第31-45页 |
4.1 设计目标 | 第31-32页 |
4.2 设计思想 | 第32-34页 |
4.2.1 系统设计组成 | 第32页 |
4.2.2 客户端设计 | 第32-33页 |
4.2.3 服务器端设计 | 第33-34页 |
4.3 总体架构 | 第34-41页 |
4.3.1 数据访问模块设计 | 第34-35页 |
4.3.2 任务设计模块设计 | 第35-37页 |
4.3.3 任务运行模块设计 | 第37-40页 |
4.3.4 元数据设计模块设计 | 第40-41页 |
4.4 主要技术难点及解决方案 | 第41-44页 |
4.4.1. 异构数据源访问 | 第41-42页 |
4.4.2. 数据类型转换 | 第42页 |
4.4.3. 数据库读写性能 | 第42-43页 |
4.4.4. 组件的抽象化 | 第43-44页 |
4.5 小结 | 第44-45页 |
第五章 通用ETL工具的实现 | 第45-53页 |
5.1 数据访问模块 | 第45-47页 |
5.2 任务设计模块 | 第47-50页 |
5.2.1 表达式编辑器 | 第47-48页 |
5.2.2 表达式组件 | 第48-49页 |
5.2.3 更新策略组件 | 第49-50页 |
5.3 元数据管理模块 | 第50-53页 |
5.3.1 数据源和数据目标元数据 | 第50-51页 |
5.3.2 转换节点元数据 | 第51-52页 |
5.3.3 控制节点元数据 | 第52-53页 |
第六章 总结和展望 | 第53-55页 |
6.1 论文总结 | 第53页 |
6.2 未来工作展望 | 第53-55页 |
参考文献 | 第55-57页 |
附录 | 第57-58页 |
致谢 | 第58-59页 |