首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

多源数据清洗策略研究及在财政部门预算中的应用

表目录第1-7页
图目录第7-8页
摘要第8-9页
ABSTRACT第9-10页
第一章 引言第10-19页
   ·金财工程与财政部门预算第10-12页
     ·金财工程的主要框架第10-11页
     ·财政部门预算概述第11-12页
   ·数据仓库与数据清洗第12-16页
     ·数据仓库概述第13-14页
     ·数据仓库的架构第14页
     ·数据清洗的概念第14-15页
     ·数据清洗研究的现状第15-16页
   ·本文的主要工作第16-19页
第二章 数据清洗相关理论第19-27页
   ·研究背景第19页
   ·数据质量第19-21页
     ·数据质量的定义第19页
     ·数据质量的衡量指标第19-20页
     ·数据质量问题第20-21页
   ·数据清洗的基本原理第21-27页
     ·数据清洗的要求及实现方式第21-23页
     ·数据清洗的一般步骤第23-24页
     ·数据清洗的质量评估第24-25页
     ·数据清洗框架模型概述第25-27页
第三章 数据清洗的策略分析第27-34页
   ·属性清洗策略第27-29页
     ·自动检测属性错误第27-29页
     ·空缺值的清洗方法第29页
     ·错误值的清洗方法第29页
     ·不一致数据的清洗方法第29页
   ·相似重复记录清洗策略第29-34页
     ·属性选择与初步聚类第29-30页
     ·相似重复记录检测第30-31页
     ·数据库级的相似重复记录聚类第31-33页
     ·衡量相似重复记录清洗方法效率的度量标准第33-34页
第四章 多源数据清洗在财政部门预算中的应用第34-47页
   ·财政部门预算数据平台应用分析第34-35页
     ·财政部门预算数据平台概述第34页
     ·财政部门预算业务需求分析第34-35页
   ·财政部门预算数据平台方案第35-37页
     ·总体结构概述第35-36页
     ·财政部门预算ETL 数据集成过程第36-37页
   ·ETL 工具的数据清洗功能第37-47页
     ·ETL 架构第37-38页
     ·多源数据的访问第38-39页
     ·数据访问端的主要功能第39-42页
     ·元数据管理与数据分发中心第42-44页
     ·ETL 的清洗转换组件第44-47页
第五章 ETL 工具中数据清洗策略的实现第47-59页
   ·财政部门预算数据质量问题分析第47-48页
   ·数据清洗策略的实现第48-53页
     ·消除相似重复记录策略的改进第48-51页
     ·包含大量空缺值列的处理第51-52页
     ·单一状态列的处理第52页
     ·非标准字段的处理第52-53页
     ·不可信极端数据的处理第53页
   ·ETL 实施数据清洗的流程第53-59页
第六章 测试及结果分析第59-62页
   ·测试实验环境第59页
   ·相似重复记录清洗测试与比较第59-60页
   ·ETL 工具数据清洗模块的测试第60-61页
   ·测试结果分析第61-62页
结束语第62-63页
参考文献第63-66页
作者简历 攻读硕士学位期间完成的主要工作第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于MDR的WEB应用程序框架设计与实现
下一篇:模型驱动的J2EE应用开发技术研究