首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于特征优选的数据清洗方法研究

摘要第1-4页
Abstract第4-9页
第一章 绪论第9-15页
   ·研究的背景及意义第9-10页
   ·数据清洗现状第10-12页
     ·国外研究现状第10-11页
     ·国内研究现状第11-12页
   ·数据清洗存在的问题第12页
   ·数据清洗的必要性第12-13页
   ·本文的研究内容与章节安排第13-14页
   ·本章小结第14-15页
第二章 数据清洗关键技术介绍第15-25页
   ·数据清洗定义第15-16页
   ·数据清洗的原理及方法第16-18页
     ·数据清洗原理第16页
     ·数据清洗方法第16-18页
   ·数据清洗基本流程第18-20页
   ·数据清洗的评价标准第20-21页
   ·预处理技术第21-23页
     ·属性选择第21-22页
     ·初步聚类第22页
     ·分配属性权值第22-23页
   ·本章小结第23-25页
第三章 数据清洗算法研究第25-37页
   ·异常记录检测算法第25-29页
     ·统计学算法第25-26页
     ·关联规则第26-27页
     ·聚类算法第27-28页
     ·算法分析第28-29页
   ·重复记录清洗算法第29-35页
     ·重复记录的定义第29页
     ·重复记录匹配算法第29-32页
     ·重复记录检测算法第32-35页
     ·衡量重复记录清洗算法效率的度量标准第35页
   ·本章小结第35-37页
第四章 基于特征优选的相似重复记录检测方法与实现第37-51页
   ·数据清洗系统框架第37-40页
     ·系统功能模块分析第38-40页
     ·系统清洗流程第40页
   ·相似重复记录清洗方法及实现第40-49页
     ·总体算法思想第41-42页
     ·计算汉字区位码第42-43页
     ·记录分组算法第43-44页
     ·特征优选方法第44-47页
     ·相似重复记录的检测第47-49页
   ·本章小结第49-51页
第五章 实验结果及分析第51-55页
   ·查准率和查全率对比第51-53页
   ·运行时间对比第53页
   ·本章小结第53-55页
第六章 总结与展望第55-57页
   ·全文总结第55页
   ·工作展望第55-57页
致谢第57-59页
参考文献第59-63页
附录A 攻读学位期间发表论文第63页

论文共63页,点击 下载论文
上一篇:基于Web Services的降水信息平台设计与实现
下一篇:构件测试用例复用方法研究与实现