首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

应用于数据质量核查的几项数据挖掘技术研究

摘要第1-7页
Abstract第7-8页
目录第8-10页
第1章 绪论第10-14页
   ·课题的研究意义第10页
   ·数据清洗技术的研究现状和发展趋势第10-12页
     ·国外研究现状第10-11页
     ·国内研究现状第11-12页
   ·存在的问题第12-13页
   ·论文的研究内容和主要工作第13页
   ·论文的组织结构第13-14页
第2章 数据质量核查技术理论综述第14-23页
   ·数据质量的相关概念第14-17页
     ·数据质量评估第14-15页
     ·数据质量问题的分类第15-17页
   ·数据质量提高技术第17-20页
     ·模式层数据质量提高技术第17-18页
     ·数据清洗技术第18-20页
   ·数据清洗的框架模型第20-23页
第3章 缺失数据的填充第23-33页
   ·缺失数据概念第23-24页
     ·缺失数据的产生原因第23-24页
     ·数据缺失机制第24页
   ·缺失数据处理第24-27页
     ·缺失数据的处理步骤第24-25页
     ·缺失数据的填充方法第25-27页
   ·使用决策树方法对缺失数据进行填充第27-32页
     ·决策树的建立过程第27-28页
     ·属性选择标准第28-30页
     ·决策树的使用过程第30页
     ·对缺失数据进行填充第30-32页
   ·本章小结第32-33页
第4章 异常数据的检测第33-47页
   ·异常数据相关概念第33-34页
   ·使用关联规则检测异常数据第34-43页
     ·数据转换第35-36页
     ·关联规则的基本概念第36-37页
     ·Apriori算法第37-39页
     ·Apriori的改进算法第39-42页
     ·算法比较分析第42-43页
     ·异常检测第43页
   ·异常数据的检测实验第43-46页
   ·本章小结第46-47页
第5章 相似重复记录的检测第47-59页
   ·重复记录的检测方法第47-49页
     ·近邻排序算法第47-48页
     ·多趟近邻排序算法第48页
     ·优先队列算法第48页
     ·算法分析第48-49页
   ·基于权值分组的重复记录检测方法第49-55页
     ·基本思想第49-50页
     ·应用等级法计算字段权值第50-51页
     ·数据集的分割第51-52页
     ·记录匹配算法第52-53页
     ·字段匹配算法第53-55页
     ·实现多趟查找第55页
   ·测试实验第55-58页
   ·本章小结第58-59页
第6章 总结与展望第59-61页
   ·全文总结第59页
   ·工作展望第59-61页
致谢第61-62页
参考文献第62-66页
攻读硕士学位期间发表的论文第66页

论文共66页,点击 下载论文
上一篇:多分类器集成技术研究
下一篇:搜索引擎结果的聚类系统研究