首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于XML元素处理的Web信息抽取研究与实现

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-16页
   ·论文研究背景及研究意义第11-12页
     ·研究背景第11-12页
     ·研究意义第12页
   ·国内外研究现状第12-14页
     ·国际研究现状第12-14页
     ·国内研究现状第14页
   ·本文主要工作及章节安排第14-16页
2 Web信息抽取介绍第16-23页
   ·Web信息抽取概述第16-17页
   ·Web信息的特点第17-20页
   ·Web信息抽取的关键技术第20-21页
   ·当前几种主要信息抽取方式的比较第21-22页
   ·本章小结第22-23页
3 XML及其相关技术介绍第23-31页
   ·XML介绍第23-26页
     ·XML的产生背景第23-24页
     ·XML文档的定义方法第24页
     ·XML的特点第24-26页
   ·XPath及XQuery介绍第26-28页
     ·XPath介绍第26-27页
     ·XQuery介绍第27-28页
   ·DOM树介绍第28-30页
   ·本章小结第30-31页
4 Web页面主体信息抽取系统设计与实现第31-58页
   ·系统框架设计第31-35页
     ·系统设计思想第31-33页
     ·XML元素第33-34页
     ·系统工作流程第34-35页
   ·系统模块结构第35-36页
   ·HTML文档处理第36-38页
     ·HTML文档处理的目的第36页
     ·HTML文档处理的方法第36-38页
   ·数据及元素处理器类型定义第38-42页
     ·数据类型定义第38-40页
     ·XML元素处理器类型定义第40-42页
   ·生成页面主体信息路径第42-48页
     ·引DOM树节点路径权值第42-46页
     ·主体信息路径生成算法第46-48页
   ·结构化信息抽取第48-53页
     ·基于XML的抽取规则配置文件第48-50页
     ·Web主体信息抽取的结果展示第50-53页
   ·Web信息抽取结果的数据库集成第53-57页
     ·XML与关系型数据库的联系第53-54页
     ·XML与关系型数据库对比第54页
     ·XML映射到关系型数据库表第54-57页
   ·本章小结第57-58页
5 系统测试结果及分析第58-62页
   ·Web信息抽取评价指标第58页
   ·系统测试环境及方法第58-59页
   ·Web主体信息抽取测试结果及分析第59-61页
   ·本章小结第61-62页
6 总结及展望第62-64页
   ·论文总结第62页
   ·展望第62-64页
参考文献第64-66页
作者简历第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:电信企业信息安全管理策略
下一篇:综合网管系统中多agent模型与结构的研究和实现