基于树匹配的交互式Web数据抽取技术的研究
第一章 绪论 | 第1-11页 |
·研究背景 | 第7-8页 |
·研究内容简介 | 第8-9页 |
·论文内容及结构 | 第9-11页 |
第二章 Web 数据抽取技术的发展 | 第11-17页 |
·Web 数据抽取系统 | 第11-13页 |
·Web 数据抽取的研究现状 | 第13-17页 |
·数据抽取方法分类 | 第13-16页 |
·存在的问题及不足 | 第16-17页 |
第三章 基于子树匹配的交互式数据抽取方法 | 第17-44页 |
·预备知识介绍 | 第18-20页 |
·XHTML | 第18-19页 |
·DOM 对象 | 第19页 |
·XPath | 第19-20页 |
·Web 文档与 DOM 树的对应 | 第20-22页 |
·TSMDE 框架模型简介 | 第22-23页 |
·模型中应用算法介绍 | 第23-31页 |
·多序列比对算法 | 第23-27页 |
·TOP-DOWN 树匹配算法 | 第27-31页 |
·TSMDE 数据抽取流程 | 第31-41页 |
·Web 文档处理转换 | 第31-32页 |
·抽取规则生成 | 第32-37页 |
·DOM 树的遍历和匹配 | 第37-39页 |
·数据的析出和保存 | 第39-41页 |
·Wrapper 的维护和更新 | 第41-44页 |
第四章 数据抽取试验 | 第44-52页 |
·数据抽取的度量指标 | 第44-45页 |
·模型系统的开发 | 第45-48页 |
·模型系统的试验结果 | 第48-51页 |
·与其他的抽取方法比较 | 第51-52页 |
第五章 总结和展望 | 第52-54页 |
·本文的创新点 | 第52页 |
·本文不足及进一步研究的方向 | 第52-54页 |
附录:试验网站数据记录示例 | 第54-56页 |
参考文献 | 第56-60页 |
发表论文和科研情况说明 | 第60-61页 |
致 谢 | 第61页 |