Web页中表格结构识别的研究与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 引言 | 第10-14页 |
·研究背景及其意义 | 第10-12页 |
·本文研究的目的和内容 | 第12-13页 |
·本文章节的安排 | 第13-14页 |
第二章 标记语言概述 | 第14-26页 |
·SGML 简介 | 第14页 |
·WEB网页的分析 | 第14-17页 |
·HTML 中的表格(TABLE) | 第17-21页 |
·XML 简介 | 第21-23页 |
·文档对象模型(DOM) | 第23-25页 |
·本章小结 | 第25-26页 |
第三章 WEB 表格信息抽取综述 | 第26-39页 |
·信息抽取与WEB信息抽取 | 第26-29页 |
·目前的WEB 信息抽取技术 | 第29-33页 |
·WEB信息抽取面临的挑战 | 第33-34页 |
·WEB表格信息抽取概述 | 第34-38页 |
·WEB表格信息抽取系统模型 | 第38页 |
·本章小结 | 第38-39页 |
第四章 WEB 表格定位技术的研究 | 第39-53页 |
·数据表格和非数据表格 | 第39页 |
·表格定位的启发式规则 | 第39-41页 |
·表格定位算法研究 | 第41-49页 |
·算法评估和实验结果 | 第49-51页 |
·本章小结 | 第51-53页 |
第五章 WEB 表格结构识别技术的研究 | 第53-82页 |
·WEB表格结构识别技术研究的目标 | 第53页 |
·WEB表格结构分析模型 | 第53-54页 |
·表格的物理存储模型设计 | 第54-60页 |
·表格结构的识别 | 第60-72页 |
·表格功能层的设计 | 第72-74页 |
·特殊表格处理 | 第74-77页 |
·实验结果评估 | 第77-81页 |
·本章小结 | 第81-82页 |
第六章 总结与展望 | 第82-84页 |
·总结 | 第82页 |
·进一步研究的方向 | 第82-84页 |
致谢 | 第84-85页 |
参考文献 | 第85-89页 |
作者攻读硕士期间取得的成果 | 第89页 |