提要 | 第1-6页 |
第1章 绪论 | 第6-14页 |
·WEB 数据挖掘概述 | 第6-9页 |
·WEB 信息抽取的研究目标 | 第9-10页 |
·WEB 信息抽取现状 | 第10-11页 |
·WEB 信息抽取方法分类 | 第11-14页 |
第2章 相关技术研究 | 第14-26页 |
·超文本文档的表示 | 第14-17页 |
·超文本文档的特征抽取 | 第17-19页 |
·超文本数据的预处理 | 第19-21页 |
·DOM 简介 | 第21-26页 |
第3章 WEB 信息的自主抽取 | 第26-47页 |
·问题描述 | 第26-28页 |
·表格信息的自主抽取 | 第28-41页 |
·列表结构信息的自主抽取 | 第41-47页 |
第4章 实验与结论 | 第47-50页 |
·实验 | 第47-49页 |
·结果和分析 | 第49-50页 |
第5章 结束语 | 第50-51页 |
·结论 | 第50页 |
·下一步的工作 | 第50-51页 |
参考文献 | 第51-54页 |
摘要 | 第54-58页 |
ABSTRACT | 第58-62页 |
致谢 | 第62页 |