基于XML元素处理的Web信息抽取研究与实现

致谢	第1-6页
摘要	第6-7页
ABSTRACT	第7-11页
1 绪论	第11-16页
·论文研究背景及研究意义	第11-12页
·研究背景	第11-12页
·研究意义	第12页
·国内外研究现状	第12-14页
·国际研究现状	第12-14页
·国内研究现状	第14页
·本文主要工作及章节安排	第14-16页
2 Web信息抽取介绍	第16-23页
·Web信息抽取概述	第16-17页
·Web信息的特点	第17-20页
·Web信息抽取的关键技术	第20-21页
·当前几种主要信息抽取方式的比较	第21-22页
·本章小结	第22-23页
3 XML及其相关技术介绍	第23-31页
·XML介绍	第23-26页
·XML的产生背景	第23-24页
·XML文档的定义方法	第24页
·XML的特点	第24-26页
·XPath及XQuery介绍	第26-28页
·XPath介绍	第26-27页
·XQuery介绍	第27-28页
·DOM树介绍	第28-30页
·本章小结	第30-31页
4 Web页面主体信息抽取系统设计与实现	第31-58页
·系统框架设计	第31-35页
·系统设计思想	第31-33页
·XML元素	第33-34页
·系统工作流程	第34-35页
·系统模块结构	第35-36页
·HTML文档处理	第36-38页
·HTML文档处理的目的	第36页
·HTML文档处理的方法	第36-38页
·数据及元素处理器类型定义	第38-42页
·数据类型定义	第38-40页
·XML元素处理器类型定义	第40-42页
·生成页面主体信息路径	第42-48页
·引DOM树节点路径权值	第42-46页
·主体信息路径生成算法	第46-48页
·结构化信息抽取	第48-53页
·基于XML的抽取规则配置文件	第48-50页
·Web主体信息抽取的结果展示	第50-53页
·Web信息抽取结果的数据库集成	第53-57页
·XML与关系型数据库的联系	第53-54页
·XML与关系型数据库对比	第54页
·XML映射到关系型数据库表	第54-57页
·本章小结	第57-58页
5 系统测试结果及分析	第58-62页
·Web信息抽取评价指标	第58页
·系统测试环境及方法	第58-59页
·Web主体信息抽取测试结果及分析	第59-61页
·本章小结	第61-62页
6 总结及展望	第62-64页
·论文总结	第62页
·展望	第62-64页
参考文献	第64-66页
作者简历	第66-68页
学位论文数据集	第68页