首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于域的中文数据清理系统分析与设计

摘要第1-4页
ABSTRACT第4-7页
第一章 引言第7-15页
   ·问题的背景第7-9页
   ·相关概念或描述第9-11页
     ·数据清洗第9-10页
     ·脏数据第10-11页
   ·国内外研究现状第11-13页
     ·国外数据清洗技术的研究与应用现状第11-12页
     ·国内相关研究现状第12-13页
   ·研究意义第13页
   ·本文的研究内容和创新点第13-14页
     ·研究内容第13-14页
     ·创新点第14页
   ·技术路线第14-15页
第二章 基于域的中文数据清洗系统框架构建第15-18页
   ·传统的数据清洗方法与步骤第15-16页
     ·数据清洗的方法第15页
     ·数据清洗的步骤第15-16页
   ·域的引入第16-17页
     ·域的概念第16页
     ·域对数据清洗系统的作用第16-17页
   ·基于域的数据清洗系统总体结构第17-18页
第三章 基于域的数据清洗系统主要模块功能设计第18-28页
   ·基于域的数据拆分与错误定义第18-21页
     ·域分类与拆分第18页
     ·域的验证规则第18-19页
     ·域内含信息的提取第19页
     ·域之间关联验证及提升第19-20页
     ·域内含信息及关联关系图第20-21页
   ·重复记录的识别与处理第21-24页
     ·字符串匹算法第21-22页
     ·重复记录检测第22-23页
     ·基于域的数据查重方法第23-24页
   ·数据提升及空值、异常数据的处理第24页
   ·数据检测及分析报告第24-28页
     ·输入数据分析报告第25-26页
     ·数据清洗结果报告第26-27页
     ·抽样记录对比报告第27-28页
第四章 基于域知识树的字段拆分方法第28-37页
   ·操作流程设计第28页
   ·字段拆分所采用的特殊方法第28-37页
     ·参照知识库的字符串识别方式第28-29页
     ·B‐树结构的数据检索第29-31页
     ·本系统中二叉 B‐树的使用过程第31-32页
     ·知识树的构造平衡算法第32-37页
第五章 结论第37-38页
参考文献第38-40页
个人简介第40-41页
导师简介第41-42页
获得成果目录清单第42-43页
致谢第43页

论文共43页,点击 下载论文
上一篇:基于智能双模手机的企业移动电邮系统的设计与实现
下一篇:现代医院物流系统建设的研究