Web页中表格结构识别的研究与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 引言 | 第10-14页 |
| ·研究背景及其意义 | 第10-12页 |
| ·本文研究的目的和内容 | 第12-13页 |
| ·本文章节的安排 | 第13-14页 |
| 第二章 标记语言概述 | 第14-26页 |
| ·SGML 简介 | 第14页 |
| ·WEB网页的分析 | 第14-17页 |
| ·HTML 中的表格(TABLE) | 第17-21页 |
| ·XML 简介 | 第21-23页 |
| ·文档对象模型(DOM) | 第23-25页 |
| ·本章小结 | 第25-26页 |
| 第三章 WEB 表格信息抽取综述 | 第26-39页 |
| ·信息抽取与WEB信息抽取 | 第26-29页 |
| ·目前的WEB 信息抽取技术 | 第29-33页 |
| ·WEB信息抽取面临的挑战 | 第33-34页 |
| ·WEB表格信息抽取概述 | 第34-38页 |
| ·WEB表格信息抽取系统模型 | 第38页 |
| ·本章小结 | 第38-39页 |
| 第四章 WEB 表格定位技术的研究 | 第39-53页 |
| ·数据表格和非数据表格 | 第39页 |
| ·表格定位的启发式规则 | 第39-41页 |
| ·表格定位算法研究 | 第41-49页 |
| ·算法评估和实验结果 | 第49-51页 |
| ·本章小结 | 第51-53页 |
| 第五章 WEB 表格结构识别技术的研究 | 第53-82页 |
| ·WEB表格结构识别技术研究的目标 | 第53页 |
| ·WEB表格结构分析模型 | 第53-54页 |
| ·表格的物理存储模型设计 | 第54-60页 |
| ·表格结构的识别 | 第60-72页 |
| ·表格功能层的设计 | 第72-74页 |
| ·特殊表格处理 | 第74-77页 |
| ·实验结果评估 | 第77-81页 |
| ·本章小结 | 第81-82页 |
| 第六章 总结与展望 | 第82-84页 |
| ·总结 | 第82页 |
| ·进一步研究的方向 | 第82-84页 |
| 致谢 | 第84-85页 |
| 参考文献 | 第85-89页 |
| 作者攻读硕士期间取得的成果 | 第89页 |