摘要 | 第1-16页 |
ABSTRACT | 第16-19页 |
第1章 绪论 | 第19-28页 |
·研究背景及意义 | 第19-20页 |
·Web数据抽取面临的问题 | 第20-21页 |
·研究内容及贡献 | 第21-26页 |
·研究环境 | 第21-23页 |
·研究内容 | 第23-24页 |
·本文贡献 | 第24-26页 |
·论文组织结构 | 第26-28页 |
第2章 Web数据抽取相关研究 | 第28-40页 |
·引言 | 第28页 |
·Web数据抽取方法分类 | 第28-35页 |
·手工构造的Web数据抽取方法 | 第29-30页 |
·半自动的Web数据抽取方法 | 第30-33页 |
·全自动的Web数据抽取方法 | 第33-35页 |
·数据模型的相关研究 | 第35-38页 |
·面临的问题 | 第38-39页 |
·小结 | 第39-40页 |
第3章 Web实体模式的动态构建方法 | 第40-54页 |
·引言 | 第40-41页 |
·问题定义 | 第41-42页 |
·构建Web实体模式 | 第42-47页 |
·新建Web实体模式 | 第43页 |
·丰富Web实体模式 | 第43-47页 |
·主要思想 | 第44页 |
·CRF模型 | 第44-45页 |
·模式丰富 | 第45-47页 |
·实验 | 第47-52页 |
·数据集 | 第47页 |
·评价标准 | 第47-48页 |
·实验结果及分析 | 第48-52页 |
·重要属性标签的识别 | 第48-49页 |
·模式信息的整体准确率 | 第49-51页 |
·训练集大小对实体模式丰富准确率的影响 | 第51-52页 |
·相关工作 | 第52-53页 |
·小结 | 第53-54页 |
第4章 基于集成学习的Web数据抽取方法 | 第54-69页 |
·引言 | 第54-55页 |
·问题定义 | 第55页 |
·Web数据抽取 | 第55-62页 |
·识别数据区域 | 第56-58页 |
·生成训练样例 | 第58-62页 |
·构建分类器 | 第58-60页 |
·分类结果合并 | 第60-62页 |
·构造包装器 | 第62页 |
·实验 | 第62-67页 |
·数据集 | 第62页 |
·评价标准 | 第62-63页 |
·实验结果及分析 | 第63-67页 |
·对于普通结构页面的数据抽取比较 | 第63-64页 |
·对于特殊结构页面的数据抽取比较 | 第64-65页 |
·不同分类器间的比较 | 第65-66页 |
·不同类型特征对识别数据区域的影响 | 第66-67页 |
·相关工作 | 第67-68页 |
·小结 | 第68-69页 |
第5章 基于二维关联边条件随机场的Web数据语义标注方法 | 第69-86页 |
·引言 | 第69-70页 |
·问题定义 | 第70-71页 |
·二维关联边条件随机场 | 第71-72页 |
·Web数据语义标注 | 第72-76页 |
·关联边 | 第73-74页 |
·参数估计 | 第74-75页 |
·推理 | 第75-76页 |
·实验 | 第76-83页 |
·数据集 | 第76页 |
·评价标准 | 第76-77页 |
·2DCC-CRFs与传统条件随机场模型的比较 | 第77-80页 |
·数据库参与与否对2DCC-CRFs模型性能的影响 | 第80-82页 |
·手工标注样本数量对模型性能的影响 | 第82-83页 |
·数据库规模对2DCC-CRFs模型性能的影响 | 第83页 |
·相关工作 | 第83-85页 |
·小结 | 第85-86页 |
第6章 基于多策略的Web实体间联系发现方法 | 第86-98页 |
·引言 | 第86页 |
·问题定义 | 第86-87页 |
·Web实体间联系发现 | 第87-93页 |
·产生候选联系 | 第87-88页 |
·评价候选联系 | 第88-92页 |
·建立一阶逻辑知识库 | 第89-91页 |
·参数学习 | 第91页 |
·推理 | 第91-92页 |
·建立Web实体间的联系 | 第92-93页 |
·实验 | 第93-95页 |
·实验设计 | 第93页 |
·评价标准 | 第93页 |
·实验结果及分析 | 第93-95页 |
·不同策略的比较 | 第93-94页 |
·不同推理方法的比较 | 第94-95页 |
·相关工作 | 第95-97页 |
·小结 | 第97-98页 |
第7章 Web数据抽取原型系统 | 第98-104页 |
·整体架构 | 第98-101页 |
·基础数据层 | 第99页 |
·支撑服务层 | 第99-100页 |
·功能服务层 | 第100-101页 |
·Web数据抽取系统工作过程 | 第101-102页 |
·小结 | 第102-104页 |
第8章 总结与展望 | 第104-106页 |
·总结 | 第104页 |
·展望 | 第104-106页 |
参考文献 | 第106-121页 |
致谢 | 第121-122页 |
攻读学位期间发表的学术论文目录 | 第122-124页 |
攻读学位期间参与科研项目情况 | 第124-125页 |
攻读学位期间获奖情况 | 第125-127页 |
学位论文评阅及答辩情况表 | 第127-129页 |
外文论文 | 第129-155页 |