基于Web的表格信息抽取研究

摘要	第1-4页
ABSTRACT	第4-5页
目录	第5-8页
第一章绪论	第8-11页
·研究背景及意义	第8-9页
·研究背景	第8页
·研究意义	第8-9页
·本文研究的目的和内容	第9-10页
·研究目的	第9页
·研究内容	第9-10页
·本文的组织结构	第10-11页
第二章信息抽取系统综述	第11-18页
·信息抽取与信息检索	第11-12页
·信息抽取系统的发展历史	第12页
·WEB信息抽取	第12-13页
·目前的WEB信息抽取方法比较	第13-16页
·自然语言处理方式的Web信息抽取	第13-14页
·包装器归纳方式的Web信息抽取	第14-15页
·ontology方式的Web信息抽取	第15页
·HTML结构的Web信息抽取	第15页
·Web查询的Web信息抽取	第15-16页
·WEB表格信息抽取概述	第16-17页
·Web表格信息抽取研究	第16-17页
·信息抽取结果的衡量标准	第17页
·本章小结	第17-18页
第三章相关技术介绍	第18-27页
·SGML简介	第18页
·HTML知识介绍	第18-20页
·HTML简介	第18-19页
·HTML语言结构	第19-20页
·WEB表格的定义、特点和作用	第20-21页
·Web表格的定义	第20-21页
·Web表格的特点	第21页
·WEB表格的分类	第21-22页
·XML语言简介	第22-25页
·XML的产生及特点	第22-25页
·XML的主要用途	第25页
·本章小结	第25-27页
第四章 WEB表格信息抽取的设计与实现	第27-47页
·系统的总体流程	第27-28页
·系统设计的整体要求	第27页
·系统的主要功能模块	第27-28页
·系统各功能模块的设计与实现	第28-42页
·网页读取	第28-29页
·WEB页清洗的功能	第29-31页
·HTML文档转变成XML文档	第31-34页
·WEB表格定位	第34-36页
·表格结构识别	第36-38页
·表格规范化	第38-42页
·特殊WEB表格的信息抽取	第42-45页
·实验结果	第45-46页
·本章小结	第46-47页
第五章总结与展望	第47-48页
·总结	第47页
·进一步研究的方向	第47-48页
参考文献	第48-52页
致谢	第52-53页