面向deep web的数据抽取与结果聚合技术研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-19页
·研究背景及意义	第10-11页
·deep web 概述以及 deep web 数据集成	第11-14页
·数据抽取技术的研究现状	第14-17页
·基于 HTML 结构化特征的抽取工具	第14-15页
·页面抽取语言	第15页
·基于模式的抽取工具	第15-16页
·基于本体的数据抽取方式	第16页
·自动抽取工具	第16页
·其他方法	第16-17页
·本文的研究内容与创新点	第17页
·本文的研究内容	第17页
·本文的创新点	第17页
·论文的结构	第17-19页
第2章相关标准与技术介绍	第19-28页
·网页的基本结构与解析技术	第19-22页
·HTML	第19-20页
·XML	第20页
·HTML 转换技术	第20-21页
·DOM	第21-22页
·搜索引擎概述	第22-23页
·ICTCLAS 分词	第23-24页
·网页聚类	第24-25页
·网页聚类相关概念	第24页
·网页聚类相关技术	第24-25页
·文档结构的相似计算模型	第25-27页
·元素比较模型	第25页
·树的编辑距离	第25-27页
·标签树路径模型	第27页
·本章小结	第27-28页
第3章 Deep web 数据自动抽取与结果聚合	第28-53页
·MDR	第28-31页
·基于标签树结构相似度的 Deep web 数据自动抽取	第31-39页
·HTML 页面预处理	第31-35页
·基于标签树结构相似度的数据记录挖掘	第35-39页
·基于树路径与子树匹配的标签树结构相似度计算	第39-46页
·子树-路径模型	第39-40页
·标签树路径公共子序列	第40-41页
·子标签树路径相似度	第41-42页
·子标签树相似度	第42-44页
·标签树相似度	第44-46页
·基于子树不完全匹配的 Deep web 数据自动抽取	第46-50页
·结果聚合	第50-51页
·本章小结	第51-53页
第4章实验与结果分析	第53-59页
·实验结果评价标准	第53-54页
·开发环境	第54页
·实验设置	第54-55页
·实验结果	第55-57页
·数据抽取实验结果	第55-56页
·结果聚合实验结果	第56-57页
·实验结果分析	第57页
·数据抽取结果分析	第57页
·结果聚合结果分析	第57页
·本章总结	第57-59页
结论	第59-60页
参考文献	第60-64页
攻读硕士学位期间发表的论文和取得的科研成果	第64-65页
致谢	第65页