基于树匹配的交互式Web数据抽取技术的研究
| 第一章 绪论 | 第1-11页 |
| ·研究背景 | 第7-8页 |
| ·研究内容简介 | 第8-9页 |
| ·论文内容及结构 | 第9-11页 |
| 第二章 Web 数据抽取技术的发展 | 第11-17页 |
| ·Web 数据抽取系统 | 第11-13页 |
| ·Web 数据抽取的研究现状 | 第13-17页 |
| ·数据抽取方法分类 | 第13-16页 |
| ·存在的问题及不足 | 第16-17页 |
| 第三章 基于子树匹配的交互式数据抽取方法 | 第17-44页 |
| ·预备知识介绍 | 第18-20页 |
| ·XHTML | 第18-19页 |
| ·DOM 对象 | 第19页 |
| ·XPath | 第19-20页 |
| ·Web 文档与 DOM 树的对应 | 第20-22页 |
| ·TSMDE 框架模型简介 | 第22-23页 |
| ·模型中应用算法介绍 | 第23-31页 |
| ·多序列比对算法 | 第23-27页 |
| ·TOP-DOWN 树匹配算法 | 第27-31页 |
| ·TSMDE 数据抽取流程 | 第31-41页 |
| ·Web 文档处理转换 | 第31-32页 |
| ·抽取规则生成 | 第32-37页 |
| ·DOM 树的遍历和匹配 | 第37-39页 |
| ·数据的析出和保存 | 第39-41页 |
| ·Wrapper 的维护和更新 | 第41-44页 |
| 第四章 数据抽取试验 | 第44-52页 |
| ·数据抽取的度量指标 | 第44-45页 |
| ·模型系统的开发 | 第45-48页 |
| ·模型系统的试验结果 | 第48-51页 |
| ·与其他的抽取方法比较 | 第51-52页 |
| 第五章 总结和展望 | 第52-54页 |
| ·本文的创新点 | 第52页 |
| ·本文不足及进一步研究的方向 | 第52-54页 |
| 附录:试验网站数据记录示例 | 第54-56页 |
| 参考文献 | 第56-60页 |
| 发表论文和科研情况说明 | 第60-61页 |
| 致 谢 | 第61页 |