第一章 诸论 | 第6-8页 |
1.1 引言 | 第6页 |
1.2 数据仓库与数据预处理技术的发展及其现状 | 第6-7页 |
1.3 本文所做工作 | 第7-8页 |
第二章 数据仓库及更新的策略 | 第8-14页 |
2.1 数据仓库与OLAP基本概念 | 第8-10页 |
2.2 数据仓库的结构设计 | 第10-11页 |
2.3 数据仓库更新的策略----工作流 | 第11-14页 |
第三章 数据预处理的重要性及其技术 | 第14-21页 |
3.1 数据预处理的重要性 | 第14-15页 |
3.1.1 数据质量问题的研究意义 | 第14-15页 |
3.1.2 数据质量问题的现状 | 第15页 |
3.2 数据预处理技术 | 第15-21页 |
3.2.1 数据处理的基本方法 | 第16-18页 |
3.2.2 Oracle 9i的ETL处理 | 第18-19页 |
3.2.3 Microsoft SQL中的DTS简介 | 第19-21页 |
第四章 DTS技术及其应用 | 第21-36页 |
4.1 数据转换系统(DTS)的功能描述 | 第21-22页 |
4.2 DTS包的组成元素 | 第22-24页 |
4.3 DTS在数据处理中的具体设计 | 第24-36页 |
4.3.1 将OLTP数据加载到数据仓库的设计 | 第24-29页 |
4.3.2 利用DTS更新数据仓库 | 第29页 |
4.3.3 数据驱动的查询任务的设计 | 第29-36页 |
第五章 异常数据的探测及重复数据的消除 | 第36-47页 |
5.1 高维数据的异常探测 | 第36-42页 |
5.1.1 问题的提出 | 第36-37页 |
5.1.2 高维异常探测算法的原理 | 第37-38页 |
5.1.3 高维异常探测的进化算法 | 第38-41页 |
5.1.4 算法的改进与小结 | 第41-42页 |
5.2 重复数据的消除 | 第42-47页 |
5.2.1 问题的提出 | 第42页 |
5.2.2 利用主动学习算法消除重复记录 | 第42-44页 |
5.2.3 算法的流程与改进 | 第44-47页 |
第六章 结束语 | 第47-48页 |
参考文献 | 第48-50页 |
致谢 | 第50-51页 |
摘要 | 第51-53页 |
ABSTRACT | 第53页 |