首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Deep Web数据源下重复记录识别模型的研究

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-18页
   ·引言第10-13页
   ·Deep Web国内外研究现状第13-16页
   ·本文解决的主要问题第16-17页
   ·本文组织结构第17-18页
第2章 相关概念及关键技术第18-30页
   ·重复记录识别第18-19页
   ·重复记录识别的研究现状第19-23页
     ·基于关系数据的重复记录识别第19-21页
     ·基于XML数据的重复记录识别第21-22页
     ·ETL第22-23页
   ·全局模式第23页
   ·技术简介第23-28页
     ·HTML第24-25页
     ·XML第25-27页
     ·DOM第27-28页
   ·本章小结第28-30页
第3章 重复记录识别模型体系结构第30-34页
   ·重复记录模型的提出第30-31页
   ·重复记录识别模式体系结构第31-33页
   ·本章小结第33-34页
第4章 基于全局模式的同构记录处理第34-44页
   ·数据预处理过程第34-38页
     ·DOM树的创建第34-36页
     ·实体记录的创建第36-38页
   ·同构记录的处理第38-43页
     ·实体记录属性值匹配关系的确定第39-42页
     ·全局模式属性权重的确定第42-43页
   ·本章小结第43-44页
第5章 基于多相似度估算器的异构记录处理第44-56页
   ·异构记录的处理过程第44页
   ·多种相似度估算器第44-52页
     ·应用多种相似度估算器的优势第44-45页
     ·已实现的多种相似度估算器第45-51页
     ·实体记录间相似度的确定第51-52页
     ·不确定相似记录的处理第52页
   ·重复记录集的确定第52-54页
   ·生成重复记录集的算法复杂度第54-55页
   ·本章小结第55-56页
第6章 实验结果及分析第56-62页
   ·重复记录识别模型的实现第56-58页
   ·实验及结果分析第58-61页
   ·本章小结第61-62页
第7章 总结与展望第62-64页
参考文献第64-68页
致谢第68-69页
攻读硕士期间发表的论文第69页

论文共69页,点击 下载论文
上一篇:基于多线索混合的交通标志识别算法的研究与实现
下一篇:电子商务中专业领域货源信息检索系统的设计与实现