首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向数据挖掘的数据预处理系统设计与实现

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-14页
   ·选题背景意义第11-12页
   ·本文主要工作第12-13页
   ·论文组织结构第13-14页
2 数据预处理综述第14-22页
   ·数据质量第14-17页
     ·数据质量问题概述第14-16页
     ·数据质量的衡量第16-17页
   ·数据清理第17-19页
     ·数据中的缺损值第17-18页
     ·数据中的噪音第18-19页
     ·重复记录的检测第19页
   ·数据集成第19-20页
   ·数据变换第20页
   ·数据约简第20-22页
3 系统的架构设计第22-29页
   ·数据预处理划分与系统需求第22-23页
   ·系统的整体框架第23-24页
   ·格式转换子系统架构第24-25页
   ·预处理算法实现环境子系统架构第25-27页
   ·数据的管理部分第27-29页
4 系统主要功能及实现第29-43页
   ·系统的启动第29-32页
     ·数据源类型选择第29-30页
     ·数据预处理主界面第30-32页
   ·数据的检查第32-33页
     ·属性类型检查与统计第32页
     ·缺损值的检查与统计第32-33页
   ·缺损值的填充处理第33-36页
     ·缺损值的填充方式第33-34页
     ·基本无监督填充第34-35页
     ·基本有监督填充第35-36页
   ·噪音数据的处理第36-39页
   ·数据的规范化第39页
   ·数据格式转换第39-43页
5 重复记录的检测第43-60页
   ·基本的检测框架第43-49页
     ·属性的相似度第43-46页
     ·记录间的比较策略第46-48页
     ·重复记录的识别第48-49页
   ·重复记录检测的实现第49-53页
     ·单属性匹配方法第49-51页
     ·线性组合匹配策略第51-53页
   ·一种改进的后缀数组分块策略第53-60页
     ·改进策略第53-54页
     ·算法思想第54-56页
     ·实验评估第56-60页
6 结论第60-62页
   ·本文工作总结第60-61页
   ·下一步研究工作第61-62页
参考文献第62-66页
作者简历第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:多媒体技术在对外汉语教学中的应用研究
下一篇:中国概况课的教学调查、分析及建议