首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

数据清理关键技术及其软件平台的研究与应用

第一章 绪论第1-26页
   ·引言第12-13页
   ·数据质量第13-17页
     ·数据质量概念及分类第13-14页
     ·单数据源数据质量问题第14-16页
     ·多数据源集成时数据质量问题第16-17页
   ·数据清理内涵及原理第17-18页
   ·数据清理研究现状分析第18-22页
     ·国外研究动态第18-20页
     ·国内研究动态第20-21页
     ·存在的问题第21-22页
   ·数据清理软件平台的意义第22-23页
   ·论文研究目的与内容安排第23-26页
第二章 单数据源中相似重复记录的清理第26-53页
   ·引言第26-27页
   ·相似重复记录清理的相关研究第27-29页
   ·相似重复记录的清理方法第29-40页
     ·相似重复记录清理方法总体描述第29-31页
     ·记录排序第31-32页
     ·记录相似检测第32-37页
     ·相似重复记录检测算法第37-39页
     ·相似重复记录的合并/清除第39-40页
   ·相似重复记录检测精度提高方法第40-43页
     ·等级法的使用第40-42页
     ·等级转变成权重的方法第42-43页
     ·利用权重提高检测精度第43页
   ·相似重复记录检测效率提高方法第43-45页
     ·提高检测效率的方法分析第43页
     ·长度过滤方法第43-45页
   ·实验准备—记录生成器的研制第45-47页
     ·记录生成器的作用第45-46页
     ·记录生成器的原理及实现第46-47页
   ·改进算法检测效果的实验验证第47-51页
     ·度量相似重复记录检测效果的标准第47-48页
     ·长度过滤方法有效性的实验检测第48-51页
     ·实验结果分析第51页
   ·本章小结第51-53页
第三章 单数据源中不完整数据的清理第53-63页
   ·引言第53页
   ·不完整数据的清理方法第53-58页
     ·不完整数据清理方法总体描述第53-55页
     ·不完整数据的可用性检测第55-57页
     ·缺失字段值的处理第57-58页
   ·采用K-最临近算法估算缺失字段值第58-62页
     ·K-NN 算法的特点第58页
     ·采用K-NN 算法估算缺失字段值的过程第58-59页
     ·K-NN 算法中距离函数的分析第59-61页
     ·采用距离权重优化K-NN 算法第61-62页
   ·本章小结第62-63页
第四章 单数据源中错误数据的清理第63-76页
   ·引言第63-64页
   ·基于孤立点检测的错误数据清理第64-70页
     ·基于孤立点检测的错误数据清理方法第64-66页
     ·孤立点检测的相关方法第66-67页
     ·基于模糊集理论的孤立点检测第67-70页
   ·基于业务规则的错误数据清理第70-74页
     ·业务规则的重要性第70-71页
     ·基于业务规则的错误数据清理方法第71-72页
     ·业务规则第72-74页
   ·错误数据的处理第74页
   ·本章小结第74-76页
第五章 多数据源集成中的数据清理第76-89页
   ·引言第76-78页
   ·信息化建设中多数据源集成问题的分类第78-80页
   ·数据标准化第80-82页
     ·数据标准化的重要性第80-81页
     ·数据标准化的方法第81-82页
   ·多数据源集成中相似重复实体的清理第82-84页
     ·相似重复实体清理的必要性第82页
     ·相似重复实体的清理方法第82-84页
   ·多数据源集成中的数据迁移第84-88页
     ·数据迁移概述第84-85页
     ·交互式数据迁移方法第85-87页
     ·交互式数据迁移的特点第87-88页
   ·本章小结第88-89页
第六章 XML 相似重复数据的清理第89-99页
   ·引言第89-91页
   ·XML 的相关知识第91-92页
   ·XML 相似重复数据的清理方法第92-94页
   ·XML 相似重复数据检测第94-96页
     ·树编辑距离定义第94-95页
     ·树编辑距离计算第95页
     ·基于树编辑距离的相似检测第95-96页
   ·XML 相似重复数据检测算法的优化第96-97页
     ·树编辑距离下限第96页
     ·树编辑距离上限第96-97页
     ·优化的XML 相似重复数据检测算法第97页
   ·本章小结第97-99页
第七章 数据清理软件平台 DCSP 的研究与应用第99-127页
   ·引言第99-100页
   ·DCSP 的原理第100-106页
     ·DCSP 的功能及清理方法第100-102页
     ·DCSP 的清理过程第102-103页
     ·DCSP 的规则库与算法库第103-106页
     ·DCSP 的特点第106页
   ·DCSP 的实现第106-110页
     ·DCSP 的开发方法第107-108页
     ·DCSP 的主要功能界面第108-110页
   ·DCSP 的应用第110-123页
     ·DCSP 在医疗保险信息系统中的应用第110-116页
     ·DCSP 在制造业信息化中的应用第116-123页
   ·本章小结第123-127页
致谢第127-128页
攻读博士学位期间发表的主要论文第128页
攻读博士学位期间主要参与的科研工作第128-129页
参考文献第129-136页

论文共136页,点击 下载论文
上一篇:论迁徙自由权入宪的必要性及其实现
下一篇:考虑边界变形的预应力鞍形索网静力分析