首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于聚类算法的数据清洗的研究与实现

中文摘要第1页
英文摘要第4-7页
第一章 引言第7-12页
   ·研究意义第7-8页
   ·数据清洗技术的研究现状和发展趋势第8-10页
     ·国外研究现状第8-9页
     ·国内研究现状第9-10页
     ·发展趋势第10页
   ·本文的研究内容与章节安排第10页
   ·本章小结第10-12页
第二章 数据清洗技术和聚类算法的原理及知识第12-23页
   ·数据清洗的定义与简介第12-13页
     ·数据仓库应用中的数据清洗定义第12-13页
     ·数据/信息质量管理应用中的数据清洗定义第13页
     ·数据清洗的形式化定义第13页
   ·数据清洗的原理与方法第13-16页
     ·数据清洗的原理第13-14页
     ·数据清洗的方法第14-16页
       ·模式层的数据清洗方法第14页
       ·实例层的数据清洗方法第14-16页
   ·数据清洗的基本过程第16-18页
   ·数据清洗的评价标准第18-19页
   ·现有的数据清洗工具及不足第19-20页
   ·聚类算法简介第20-21页
   ·聚类方法的分类第21-22页
   ·本章小结第22-23页
第三章 对缺失值进行清洗的研究第23-34页
   ·缺失值清洗简述第23页
   ·对缺失值进行填充的清洗算法第23-24页
     ·采用分类方法清洗缺失值第23-24页
     ·采用统计方法清洗缺失值第24页
     ·采用关联规则清洗缺失值第24页
   ·基于密度的DBSCAN 算法在缺失值填充中的研究第24-28页
     ·基本的DBSCAN 算法第24-26页
     ·DBSCAN 算法在缺失值填充中的应用第26-28页
   ·改进的DBSCAN 算法在缺失值填充中的应用研究第28-29页
   ·实验对比结果及分析第29-33页
     ·实验说明第29-30页
     ·实验结果及分析第30-33页
   ·本章小结第33-34页
第四章 对重复记录进行数据清洗的研究第34-51页
   ·数据清洗前的预处理第34页
   ·基于聚类的多表记录匹配问题第34-44页
     ·重复记录检测中的匹配问题第34-37页
       ·字段匹配问题第35-37页
       ·记录匹配问题第37页
     ·改进的多表记录匹配算法第37-44页
       ·改进的算法第37-39页
       ·算法在多表记录匹配中的应用第39-41页
       ·算法复杂度分析第41页
       ·实验结果对比与分析第41-44页
   ·基于聚类的重复记录清洗算法第44-49页
     ·现有的重复记录清洗算法第44-46页
       ·排序近邻方法第44页
       ·优先权队列算法第44-45页
       ·多路数据清洗方法第45页
       ·增量数据清洗第45页
       ·独立于领域知识的数据清洗第45页
       ·与数据库管理系统集成的数据清洗第45-46页
     ·改进的重复记录清洗算法第46-49页
       ·改进的算法第46-48页
       ·算法复杂度分析第48页
       ·重复记录的删除第48页
       ·实验结果及分析第48-49页
   ·本章小结第49-51页
第五章 总结与展望第51-53页
   ·工作总结第51页
   ·工作展望第51-53页
参考文献第53-57页
致谢第57-58页
附录第58-59页
在学期间发表的学术论文第59页

论文共59页,点击 下载论文
上一篇:意义生成:当代大学教学价值的新取向
下一篇:《现代汉语词典》动宾式动词释义元语言的句法语义规则研究