首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

数据清洗中相似记录检测的研究

摘要第1-6页
Abstract第6-7页
目录第7-10页
第一章 绪论第10-15页
   ·研究背景和意义第10-11页
   ·研究现状和趋势第11-13页
     ·国外研究现状第11-12页
     ·国内研究现状第12-13页
     ·发展趋势第13页
   ·论文的结构安排第13-14页
   ·本章小结第14-15页
第二章 相似记录检测的研究第15-27页
   ·相似记录检测的概述第15-16页
     ·相似记录检测的定义第15-16页
     ·数据清洗预处理第16页
   ·字段匹配算法第16-21页
     ·基本的字段匹配算法第17页
     ·递归的字段匹配算法第17-18页
     ·Smith-Waterman算法第18页
     ·改进的Smith-Waterman算法第18-19页
     ·基于N-gram的字符串匹配算法第19-20页
     ·中文字段匹配算法第20-21页
   ·相似记录匹配度量第21-24页
     ·欧几里得几何距离第23页
     ·曼哈顿距离第23页
     ·明考斯基距离第23-24页
     ·余弦度量第24页
   ·记录相似度度量(Similarity Measure)方法第24-25页
   ·相似记录的处理与算法评价标准第25-26页
     ·相似记录的处理第25页
     ·算法评价标准第25-26页
   ·本章小结第26-27页
第三章 聚类算法分析与比较研究第27-51页
   ·基于划分的方法第30-35页
     ·传统划分方法第30-34页
     ·大型数据库的划分方法第34-35页
   ·基于层次的方法第35-42页
     ·两种基本层次聚类方法第35-37页
     ·改进层次聚类方法第37-42页
   ·基于密度的方法第42-44页
     ·DBSCAN算法第42-43页
     ·OPT1CS算法第43-44页
   ·基于网格的方法第44-46页
     ·STING算法第44-45页
     ·CLIQUE算法第45-46页
   ·基于模型的方法(Model-Based Method)第46-47页
   ·中文聚类第47-50页
   ·本章小结第50-51页
第四章 系统设计与实现第51-62页
   ·系统设计思想第51-53页
   ·系统运行平台第53-54页
   ·实验数据分析第54页
   ·系统数据库表结构第54-55页
   ·各功能模块实现第55-57页
     ·建立倒排索引模块实现第55-56页
     ·提取特征值第56-57页
     ·聚类模块实现第57页
   ·实现结果评价第57-62页
第五章 总结与展望第62-64页
   ·总结第62页
   ·展望第62-64页
参考文献第64-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:基于CAN总线和嵌入式Internet的教室资源管理系统
下一篇:基于智能卡的口令认证协议的分析和设计