面向领域的Web数据集成中数据抽取的研究
| 摘要 | 第1-10页 |
| ABSTRACT | 第10-12页 |
| 第一章 绪论 | 第12-16页 |
| ·研究背景 | 第12-14页 |
| ·本文所做的主要工作 | 第14-15页 |
| ·本文的结构 | 第15-16页 |
| 第二章 Web数据抽取技术的相关研究 | 第16-21页 |
| ·Web数据抽取技术 | 第16-18页 |
| ·Web数据抽取方法的研究现状 | 第18-20页 |
| ·本章小结 | 第20-21页 |
| 第三章 面向领域的Web数据抽取系统 | 第21-35页 |
| ·面向领域的Web数据抽取系统模型DWEXT | 第21-22页 |
| ·DWEXT系统架构组成 | 第22-33页 |
| ·获取标签层 | 第22-23页 |
| ·数据源层 | 第23-24页 |
| ·预处理层 | 第24页 |
| ·数据抽取层 | 第24-28页 |
| ·标签分配层 | 第28-31页 |
| ·应用层 | 第31-33页 |
| ·相关定义 | 第33-34页 |
| ·本章小结 | 第34-35页 |
| 第四章 标签识别 | 第35-45页 |
| ·Web Form标签的抽取 | 第35-43页 |
| ·识别列表页面中的标签 | 第43-44页 |
| ·本章小结 | 第44-45页 |
| 第五章 数据抽取 | 第45-65页 |
| ·数据区域的识别 | 第45-50页 |
| ·划分数据记录 | 第50-55页 |
| ·Simple Tree Matching算法 | 第50-52页 |
| ·划分过程 | 第52-55页 |
| ·数据抽取器的生成 | 第55-64页 |
| ·本章小结 | 第64-65页 |
| 第六章 实验分析 | 第65-76页 |
| ·抽取的度量指标 | 第65页 |
| ·DWEXT系统的开发 | 第65-66页 |
| ·实验结果 | 第66-75页 |
| ·标签识别的实验分析 | 第66-69页 |
| ·数据抽取的实验分析 | 第69-73页 |
| ·DWEXT系统的实验分析 | 第73-75页 |
| ·本章小结 | 第75-76页 |
| 第七章 总结和展望 | 第76-79页 |
| ·本文的工作总结 | 第76-77页 |
| ·未来工作展望 | 第77-79页 |
| 参考文献 | 第79-83页 |
| 致谢 | 第83-84页 |
| 攻读硕士学位期间发表的学术论文 | 第84-85页 |
| 学位论文评阅及答辩情况表 | 第85页 |