多源异构数据治理平台设计与实现
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第一章 绪论 | 第12-16页 |
1.1 研究背景及内容 | 第12-13页 |
1.1.1 选题背景 | 第12页 |
1.1.2 研究内容 | 第12-13页 |
1.2 国内外研究现状 | 第13-14页 |
1.3 论文主要工作 | 第14-15页 |
1.3.1 多源异构数据的元数据发现 | 第14页 |
1.3.2 基于元数据的数据质量管理 | 第14-15页 |
1.4 论文组织和结构 | 第15-16页 |
第二章 相关技术介绍 | 第16-23页 |
2.1 数据治理技术介绍 | 第16-17页 |
2.2 元数据管理技术介绍 | 第17-19页 |
2.2.1 元数据发现技术介绍 | 第17-18页 |
2.2.2 元数据存储技术介绍 | 第18-19页 |
2.3 数据质量管理技术介绍 | 第19-20页 |
2.3.1 数据验证技术介绍 | 第19页 |
2.3.2 数据清洗技术介绍 | 第19-20页 |
2.4 数据溯源技术介绍 | 第20-21页 |
2.5 链路追踪技术介绍 | 第21页 |
2.6 本章小结 | 第21-23页 |
第三章 数据治理平台需求分析 | 第23-28页 |
3.1 典型业务场景分析 | 第23-24页 |
3.2 功能性需求 | 第24-27页 |
3.2.1 元数据管理 | 第24-25页 |
3.2.2 数据质量管理 | 第25-26页 |
3.2.3 数据应用 | 第26-27页 |
3.3 非功能需求 | 第27页 |
3.3.1 吞吐量 | 第27页 |
3.3.2 响应时间 | 第27页 |
3.3.3 变更数据源的治理能力 | 第27页 |
3.4 本章小结 | 第27-28页 |
第四章 关键问题研究及解决方案 | 第28-42页 |
4.1 多源异构数据元数据发现方案 | 第28-35页 |
4.1.1 问题描述 | 第29页 |
4.1.2 算法定义 | 第29-31页 |
4.1.3 方案流程 | 第31-33页 |
4.1.4 实验效果 | 第33-35页 |
4.1.5 小结 | 第35页 |
4.2 多源异构数据的验证 | 第35-41页 |
4.2.1 问题描述 | 第36页 |
4.2.2 问题建模 | 第36-37页 |
4.2.3 算法流程 | 第37-39页 |
4.2.4 实验效果 | 第39-41页 |
4.3 本章小节 | 第41-42页 |
第五章 平台总体设计 | 第42-49页 |
5.1 总体架构 | 第42-44页 |
5.1.1 模块分层划分 | 第42-44页 |
5.2 系统划分介绍 | 第44-46页 |
5.2.1 数据访问层接口 | 第44页 |
5.2.2 元数据管理层接口 | 第44-45页 |
5.2.3 数据质量管理层模块 | 第45页 |
5.2.4 应用层模块 | 第45-46页 |
5.3 系统层次交互关系及接口设计 | 第46-48页 |
5.3.1 元数据发现流程 | 第46-47页 |
5.3.2 多源数据验证流程 | 第47-48页 |
5.4 本章小结 | 第48-49页 |
第六章 平台详细设计 | 第49-92页 |
6.1 事件系统设计 | 第49-54页 |
6.1.1 事件系统核心概念 | 第49-50页 |
6.1.2 事件系统工作机制 | 第50页 |
6.1.3 事件系统设计 | 第50-52页 |
6.1.4 数据治理平台模块工作流程 | 第52-54页 |
6.2 数据访问层模块设计 | 第54-62页 |
6.2.1 RDB DAO模块设计 | 第59-60页 |
6.2.2 KV DAO模块 | 第60-62页 |
6.3 元数据管理层模块设计 | 第62-77页 |
6.3.1 元数据发现 | 第62-64页 |
6.3.2 元数据更新 | 第64-67页 |
6.3.3 元数据查询 | 第67-70页 |
6.3.4 数据模式监视 | 第70-71页 |
6.3.5 踪迹信息收集 | 第71-74页 |
6.3.6 元数据存储 | 第74-75页 |
6.3.7 关键方法实现 | 第75-77页 |
6.4 数据治理管理层模块设计 | 第77-84页 |
6.4.1 数据验证模块 | 第78-79页 |
6.4.2 数据清洗模块 | 第79-80页 |
6.4.3 规则执行模块 | 第80-81页 |
6.4.4 规则生成模块 | 第81-82页 |
6.4.5 规则存储模块 | 第82-83页 |
6.4.6 关键方法实现 | 第83-84页 |
6.5 应用层模块设计 | 第84-92页 |
6.5.1 数据源维护模块 | 第84-89页 |
6.5.2 数据历史查询模块 | 第89-90页 |
6.5.3 数据溯源模块 | 第90-92页 |
第七章 平台部署与测试 | 第92-103页 |
7.1 测试环境部署 | 第92-93页 |
7.1.1 部署环境 | 第92页 |
7.1.2 部署方案 | 第92-93页 |
7.2 典型集成测试用例 | 第93-101页 |
7.2.1 元数据发现 | 第93-95页 |
7.2.2 元数据更新 | 第95-99页 |
7.2.3 多源异构数据验证 | 第99-101页 |
7.2.4 数据溯源 | 第101页 |
7.3 性能测试结果 | 第101-102页 |
7.4 测试结果分析 | 第102页 |
7.5 本章小结 | 第102-103页 |
第八章 总结与展望 | 第103-105页 |
8.1 论文工作总结 | 第103页 |
8.2 研究展望 | 第103-105页 |
参考文献 | 第105-109页 |
致谢 | 第109-110页 |
攻读硕士学位期间发表论文 | 第110页 |