首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据清洗的若干关键技术研究

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-19页
   ·研究背景第11页
   ·数据质量第11-14页
     ·数据质量概念第12页
     ·数据质量分类第12-14页
   ·数据清洗研究的必要性第14-15页
   ·数据清洗技术研究现状第15-17页
     ·国外研究现状第15-16页
     ·国内研究现状第16页
     ·存在的问题第16-17页
   ·本文的工作第17页
   ·论文的组织结构第17-19页
第二章 数据清洗相关理论研究第19-38页
   ·数据清洗定义第19-20页
     ·数据仓库应用中的数据清洗定义第19页
     ·数据/信息质量管理应用中的数据清洗定义第19-20页
     ·KDD应用中的数据清洗定义第20页
   ·数据清洗的原理第20-21页
   ·异常记录检测的常用算法第21-24页
     ·统计学算法第21-22页
     ·关联规则第22-23页
     ·聚类算法第23-24页
     ·算法分析第24页
   ·重复记录检测的常用算法第24-26页
     ·基本近邻排序算法SNM第25页
     ·多趟近邻排序算法MPN第25-26页
     ·优先权队列算法第26页
     ·算法分析第26页
   ·数据清洗的策略第26-28页
     ·模式层的数据清洗策略第26-27页
     ·实例层的数据清洗策略第27-28页
   ·数据清洗的评价标准第28-29页
     ·数据质量第28-29页
     ·成本效益第29页
     ·数据集成第29页
   ·元数据管理第29-35页
     ·元数据定义第29-30页
     ·为什么需要元数据第30-32页
     ·元数据来源第32-33页
     ·元数据分类第33-34页
     ·元数据的管理结构第34-35页
   ·数据清洗的基本流程第35-37页
   ·本章小结第37-38页
第三章 基于等级分组的相似重复记录检测方法第38-47页
   ·基本思想第38-39页
   ·基本定义第39-40页
   ·基本步骤第40-44页
     ·等级法计算权值第40-41页
     ·数据分组第41-42页
     ·字段匹配算法第42-43页
     ·算法描述第43-44页
   ·实验第44-46页
     ·查准率和查全率对比第45页
     ·时间对比第45-46页
   ·本章小结第46-47页
第四章 基于加权快速聚类的异常记录检测算法第47-55页
   ·相关研究第47页
   ·基本思想第47-48页
   ·步聚第48-52页
     ·度量标准第48页
     ·参数优化第48-49页
     ·选择中心点第49-51页
     ·迭代分类第51-52页
     ·快速聚类法的结果第52页
   ·实验第52-54页
     ·时间对比第53页
     ·精度对比第53-54页
   ·本章小结第54-55页
第五章 可扩展和可交互的数据清洗系统第55-66页
   ·清洗原因第55-56页
   ·数据清洗系统框架第56页
   ·数据检测第56-58页
   ·数据清洗第58-59页
   ·元数据第59页
   ·数据评估第59页
   ·特点第59-60页
   ·流程图第60页
   ·应用第60-65页
     ·系统服务器配置以及开发工具第61页
     ·系统部份功能简介第61-65页
   ·本章小结第65-66页
第六章 结束语第66-68页
   ·全文总结第66页
   ·工作展望第66-68页
参考文献第68-71页
致谢第71-72页
论文及科研情况第72页

论文共72页,点击 下载论文
上一篇:关于B-S模型和Lévy型股票价格模型的推广研究
下一篇:无线电台监测仪的设计与实现