摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第17-37页 |
1.1 研究的背景和意义 | 第17-23页 |
1.1.1 数据可用性 | 第17-19页 |
1.1.2 XML 数据 | 第19-20页 |
1.1.3 研究的问题、挑战及意义 | 第20-23页 |
1.2 国内外研究现状及分析 | 第23-34页 |
1.2.1 数据一致性 | 第23-25页 |
1.2.2 数据完整性 | 第25-26页 |
1.2.3 数据精确性 | 第26页 |
1.2.4 数据时效性 | 第26-27页 |
1.2.5 实体同一性 | 第27-33页 |
1.2.6 不同可用性维度的相互作用 | 第33页 |
1.2.7 结论及存在的问题 | 第33-34页 |
1.3 本文主要研究内容和组织结构 | 第34-36页 |
1.4 本文的章节安排 | 第36-37页 |
第2章 预备知识 | 第37-43页 |
2.1 实体同一性的相关知识 | 第37-38页 |
2.2 XML 的相关知识 | 第38-42页 |
2.2.1 XML 数据模型 | 第38-39页 |
2.2.2 XML 查询 | 第39-41页 |
2.2.3 XML 键规则 | 第41-42页 |
2.3 本章小结 | 第42-43页 |
第3章 基于规则的 XML 实体抽取方法 | 第43-79页 |
3.1 问题简介 | 第43-46页 |
3.2 XML 实体的定义及表示 | 第46-47页 |
3.3 实体抽取方法 KEE | 第47-54页 |
3.3.1 生成初始位置查询 | 第48-49页 |
3.3.2 生成候选位置查询集合 | 第49-51页 |
3.3.3 验证位置查询并抽取属性查询 | 第51-53页 |
3.3.4 KEE 中实体抽取问题的形式化定义 | 第53-54页 |
3.4 实体抽取算法 | 第54-64页 |
3.4.1 简单算法 | 第54-56页 |
3.4.2 SharingEE 算法 | 第56-64页 |
3.4.3 算法分析 | 第64页 |
3.5 算法的扩展 | 第64-66页 |
3.5.1 参数的设定 | 第64-65页 |
3.5.2 键规则的选择 | 第65-66页 |
3.6 实验结果 | 第66-77页 |
3.6.1 实验设置 | 第66-67页 |
3.6.2 算法的有效性 | 第67-74页 |
3.6.3 算法的运行效率 | 第74-77页 |
3.7 相关工作 | 第77-78页 |
3.8 本章小结 | 第78-79页 |
第4章 基于哈希的 XML 实体匹配方法 | 第79-107页 |
4.1 问题简介 | 第79-80页 |
4.2 问题定义及背景知识 | 第80-83页 |
4.2.1 匹配函数框架 | 第80-81页 |
4.2.2 XML 实体匹配问题 | 第81-82页 |
4.2.3 局部敏感哈希技术 | 第82-83页 |
4.3 基于哈希的 XML 实体匹配算法 | 第83-97页 |
4.3.1 简单的匹配函数及 EMM1 算法 | 第83-86页 |
4.3.2 EMM1算法的性能 | 第86-89页 |
4.3.3 扩展内容相似函数 | 第89-94页 |
4.3.4 扩展结构相似函数 | 第94-97页 |
4.4 实验结果 | 第97-105页 |
4.4.1 实验设置 | 第97页 |
4.4.2 算法的有效性 | 第97-101页 |
4.4.3 算法映射数据的时间效率 | 第101-103页 |
4.4.4 算法匹配实体的时间效率 | 第103-104页 |
4.4.5 真实数据上的性能 | 第104-105页 |
4.5 相关工作 | 第105-106页 |
4.6 本章小结 | 第106-107页 |
第5章 XML 实体匹配结果的消解方法 | 第107-140页 |
5.1 问题简介 | 第107-109页 |
5.2 实体匹配结果消解问题 | 第109-110页 |
5.2.1 实体匹配图及消解图 | 第109-110页 |
5.2.2 两种问题定义 | 第110页 |
5.3 最小化图代价的消解问题的分析及算法 | 第110-125页 |
5.3.1 相关定义及符号 | 第110-113页 |
5.3.2 计算复杂性分析 | 第113-117页 |
5.3.3 特殊情况下的有效算法 | 第117-120页 |
5.3.4 近似算法 | 第120-125页 |
5.4 最小化边权值的消解问题的分析及算法 | 第125-134页 |
5.4.1 计算复杂性分析 | 第125-126页 |
5.4.2 近似算法 | 第126-129页 |
5.4.3 启发式算法 | 第129-134页 |
5.5 实验结果 | 第134-139页 |
5.5.1 实验设置 | 第136页 |
5.5.2 算法的有效性 | 第136-138页 |
5.5.3 算法的时间效率 | 第138-139页 |
5.6 本章小结 | 第139-140页 |
第6章 XML 实体识别中的优化问题分析 | 第140-165页 |
6.1 问题简介 | 第140-141页 |
6.2 XML 查询学习问题的计算复杂性及可近似性 | 第141-154页 |
6.2.1 问题定义 | 第141-142页 |
6.2.2 TQL 问题的计算复杂性 | 第142-151页 |
6.2.3 不可近似结果 | 第151-153页 |
6.2.4 相关工作 | 第153-154页 |
6.3 实体消解问题的固定参数复杂性 | 第154-163页 |
6.3.1 问题定义 | 第154-155页 |
6.3.2 p-LCCm问题 | 第155-157页 |
6.3.3 p-LCCn问题 | 第157页 |
6.3.4 p-LCCk问题 | 第157-163页 |
6.4 本章小结 | 第163-165页 |
结论 | 第165-168页 |
参考文献 | 第168-186页 |
攻读博士学位期间发表的论文及其他成果 | 第186-188页 |
致谢 | 第188-190页 |
个人简历 | 第190页 |