首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

数据万维网自动实体匹配

摘要第5-6页
ABSTRACT第6页
1 引言第11-19页
    1.1 数据万维网简介第11-14页
    1.2 实体匹配问题的提出第14-17页
    1.3 我们的实体匹配解决方案第17-18页
    1.4 本章小结第18-19页
2 国内外研究现状第19-25页
    2.1 数据库领域的相关工作第19-22页
    2.2 语义万维网领域的相关工作第22-23页
    2.3 面向实体匹配的数据分块方法第23-24页
    2.4 实体匹配的评测标准第24页
    2.5 本章小结第24-25页
3 解决方案概述第25-29页
    3.1 问题定义第25-27页
    3.2 方案设计中的取舍第27-28页
        3.2.1 选取实体特征时的取舍第27页
        3.2.2 原始数据预处理中的取舍第27页
        3.2.3 分块阶段的取舍第27-28页
        3.2.4 聚类阶段的取舍第28页
    3.3 本章小结第28-29页
4 实体特征选取第29-32页
    4.1 基本特征和扩展特征第29-30页
    4.2 采用基本特征的原因第30-31页
    4.3 本章小结第31-32页
5 原始数据预处理第32-36页
    5.1 统一数据文件格式第32-33页
    5.2 清理数据中的垃圾第33页
    5.3 收集实体相关信息第33-34页
    5.4 针对特定数据集的操作第34-35页
    5.5 本章小结第35-36页
6 实体集分块第36-39页
    6.1 传统方法的问题第36-37页
    6.2 我们的分块方法第37-38页
    6.3 本章小结第38-39页
7 分块内的实体聚类第39-43页
    7.1 传统聚类方法的问题第39-40页
    7.2 我们采用的聚类方法第40-42页
    7.3 我们方法的问题以及如何克服第42页
    7.4 本章小结第42-43页
8 实验与讨论第43-60页
    8.1 实验数据集介绍第43-44页
    8.2 实体匹配效果评测方案第44-45页
    8.3 分块阶段评测结果第45-51页
        8.3.1 可扩展性评测结果第45-46页
        8.3.2 分块大小评测结果第46-50页
        8.3.3 有效性评测结果第50-51页
    8.4 聚类阶段评测结果第51-55页
        8.4.1 可扩展性评测结果第51-53页
        8.4.2 有效性评测结果第53-55页
    8.5 观察与讨论第55-59页
    8.6 本章小结第59-60页
9 总结与展望第60-61页
参考文献第61-66页
致谢第66-67页
攻读学位期间发表的学术论文第67-68页
攻读学位期间参加的科研项目第68-69页
攻读学位期间出席的学术会议第69-72页

论文共72页,点击 下载论文
上一篇:大型港口码头管理系统改造关键技术研究及实现
下一篇:Unbound域名系统软件的性能优化及安全性分析