| 提要 | 第1-6页 |
| 第1章 绪论 | 第6-14页 |
| ·WEB 数据挖掘概述 | 第6-9页 |
| ·WEB 信息抽取的研究目标 | 第9-10页 |
| ·WEB 信息抽取现状 | 第10-11页 |
| ·WEB 信息抽取方法分类 | 第11-14页 |
| 第2章 相关技术研究 | 第14-26页 |
| ·超文本文档的表示 | 第14-17页 |
| ·超文本文档的特征抽取 | 第17-19页 |
| ·超文本数据的预处理 | 第19-21页 |
| ·DOM 简介 | 第21-26页 |
| 第3章 WEB 信息的自主抽取 | 第26-47页 |
| ·问题描述 | 第26-28页 |
| ·表格信息的自主抽取 | 第28-41页 |
| ·列表结构信息的自主抽取 | 第41-47页 |
| 第4章 实验与结论 | 第47-50页 |
| ·实验 | 第47-49页 |
| ·结果和分析 | 第49-50页 |
| 第5章 结束语 | 第50-51页 |
| ·结论 | 第50页 |
| ·下一步的工作 | 第50-51页 |
| 参考文献 | 第51-54页 |
| 摘要 | 第54-58页 |
| ABSTRACT | 第58-62页 |
| 致谢 | 第62页 |