Deep Web环境下重名实体识别研究
| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 目录 | 第7-9页 |
| 第1章 引言 | 第9-15页 |
| ·问题提出 | 第9-10页 |
| ·国内外研究现状 | 第10-13页 |
| ·本文的研究内容 | 第13-14页 |
| ·本文的组织结构 | 第14页 |
| ·本章小结 | 第14-15页 |
| 第2章 相关概念与技术 | 第15-25页 |
| ·Web信息抽取 | 第15-17页 |
| ·Deep Web 介绍 | 第17-19页 |
| ·相关概念 | 第19-22页 |
| ·HTML | 第19-21页 |
| ·XML | 第21-22页 |
| ·常用的聚类算法 | 第22-24页 |
| ·划分方法 | 第22-23页 |
| ·层次聚类 | 第23-24页 |
| ·谱聚类 | 第24页 |
| ·本章小结 | 第24-25页 |
| 第3章 Deep Web环境下重名实体识别模型 | 第25-29页 |
| ·重名实体识别模型的提出 | 第25页 |
| ·重名实体识别模型体系结构 | 第25-28页 |
| ·本章小结 | 第28-29页 |
| 第4章 基于XML Schema的数据预处理 | 第29-41页 |
| ·全局模式实体记录描述 | 第30-35页 |
| ·实体记录属性信息获取 | 第35-39页 |
| ·本章小结 | 第39-41页 |
| 第5章 基于聚类的重名实体识别算法 | 第41-61页 |
| ·实体属性相似度计算 | 第41-47页 |
| ·多类型相似度计算方法 | 第41-45页 |
| ·基于领域的约束规则构建 | 第45-47页 |
| ·实体记录整体相似度计算 | 第47-50页 |
| ·特征权重值的确定 | 第48-49页 |
| ·整体相似度计算 | 第49-50页 |
| ·相似实体聚类算法实现 | 第50-53页 |
| ·重名实体识别算法在文献领域中的应用 | 第53-60页 |
| ·约束规则及相似度计算 | 第53-56页 |
| ·引文重名实体识别 | 第56-58页 |
| ·作者重名实体识别 | 第58-60页 |
| ·会议重名实体识别 | 第60页 |
| ·本章小结 | 第60-61页 |
| 第6章 实验分析 | 第61-69页 |
| ·实验设置 | 第61-62页 |
| ·实验环境设置 | 第61页 |
| ·实验评价指标 | 第61-62页 |
| ·实验数据集 | 第62-64页 |
| ·实验结果及分析 | 第64-68页 |
| ·重名实体识别算法的准确度分析 | 第64-66页 |
| ·Deep Web信息对重名实体识别贡献度的验证 | 第66页 |
| ·约束规则对重名实体识别贡献度的验证 | 第66-67页 |
| ·凝聚层次聚类与近邻传播聚类的对比实验 | 第67-68页 |
| ·本章小结 | 第68-69页 |
| 第7章 总结及展望 | 第69-71页 |
| ·本文的主要工作 | 第69-70页 |
| ·未来研究工作 | 第70-71页 |
| 参考文献 | 第71-75页 |
| 致谢 | 第75-77页 |
| 攻硕期间科研及发表论文情况 | 第77页 |