首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web数据集成中数据清洗的关键问题研究

摘要第1-11页
ABSTRACT第11-13页
第一章 绪论第13-19页
   ·研究背景第13-14页
   ·研究现状第14-17页
     ·国外研究现状第14-16页
     ·国内研究现状第16-17页
   ·研究内容和主要工作第17页
   ·本文的组织结构第17-19页
第二章 数据清洗理论综述第19-30页
   ·数据质量第19-20页
   ·数据质量问题第20-22页
   ·数据清洗定义第22-23页
   ·数据清洗的原理与基本流程第23-26页
   ·数据清洗评估第26-28页
   ·数据清洗方案第28-30页
第三章 数据清洗的相关技术第30-40页
   ·不完整数据相关概念第30-32页
     ·不完整数据的处理方法第30-31页
     ·缺失值的处理第31-32页
   ·异常数据的处理第32-36页
     ·异常数据相关概念第32-34页
     ·基干孤立点检测异常数据第34-36页
   ·重复记录的处理第36-40页
     ·重复记录的定义第36-37页
     ·重复记录清洗的流程第37-39页
     ·重复记录清洗的重要性第39-40页
第四章 基于权值分级的相似重复记录检测方法第40-49页
   ·基本思想第40-41页
   ·基本定义第41-42页
   ·基本步骤第42-47页
     ·级别法计算权值第42-43页
     ·数据分组第43-45页
     ·字段匹配算法第45-46页
     ·算法描述第46-47页
   ·本章小结第47-49页
第五章 数据清洗在WEB数据集成中的运用第49-61页
   ·应用背景第49页
   ·WEB数据集成第49-53页
     ·Web数据的特点第49-51页
     ·XML的特点第51-52页
     ·基于XML的Web数据集成框架第52-53页
   ·WEB数据集成中数据清洗的框架第53-58页
     ·XML到数据库的映射第54-55页
     ·数据清洗预处理第55-58页
   ·重复记录的检测第58页
   ·实验第58-60页
     ·实验环境及说明第58页
     ·查准率和查全率对比第58-59页
     ·时间对比第59-60页
   ·本章小结第60-61页
第六章 总结与展望第61-63页
   ·本文工作总结第61-62页
   ·未来工作展望第62-63页
参考文献第63-67页
致谢第67-68页
攻读学位期间发表的学术论文第68-69页
学位论文评阅及答辩情况表第69页

论文共69页,点击 下载论文
上一篇:非经典关系数据库中约束关系模型在查询优化中的应用
下一篇:数据库模式匹配方法的研究