基于XML的Web信息抽取研究与实现

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-15页
·课题研究背景和意义	第9-10页
·国内外研究现状与分析	第10-12页
·本文的研究内容	第12-13页
·本文解决的关键问题	第13-14页
·论文组织结构	第14-15页
第2章 Web信息抽取研究与相关技术标准	第15-24页
·Web信息抽取方法	第15-18页
·系统涉及的相关技术标准	第18-22页
·HTML、XHTML与XML	第18-21页
·DOM、XPath与XSLT	第21-22页
·XML在Web信息抽取中的应用	第22-23页
·本章小结	第23-24页
第3章基于XML的Web信息抽取系统的设计	第24-30页
·Web信息抽取系统的难点	第24-25页
·Web信息抽取系统的目标	第25页
·Web信息抽取系统的核心工作	第25-26页
·Web信息抽取系统的设计	第26-29页
·整体研究思路	第26-27页
·系统设计思想	第27-28页
·系统工作流程图	第28-29页
·本章小结	第29-30页
第4章基于XML的Web信息抽取系统的实现	第30-47页
·数据采集	第30-31页
·页面优化处理	第31-36页
·页面清洗	第32-34页
·页面解析	第34-36页
·抽取规则学习	第36-43页
·获取XPath路径	第36-37页
·XSLT作为抽取规则	第37-38页
·生成抽取规则	第38-40页
·抽取规则优化处理	第40-43页
·信息抽取	第43-45页
·XSLT转换原理	第43页
·信息抽取结果	第43-45页
·信息抽取系统评价	第45-46页
·本章小结	第46-47页
第5章 Web信息抽取系统中关键技术的实现	第47-64页
·基于XML的Web数据转换技术	第47-55页
·相关技术	第47-49页
·现有的Web数据转换方法	第49-50页
·Web数据转换方法规划	第50-51页
·基于XML的Web数据转换算法	第51-54页
·实验分析	第54-55页
·基于DOM的XPath生成技术	第55-63页
·相关技术	第56-60页
·XPath生成方法规划	第60页
·基于DOM的XPath生成算法	第60-62页
·实验分析	第62-63页
·本章小结	第63-64页
第6章总结与展望	第64-66页
·论文总结	第64-65页
·工作展望	第65-66页
参考文献	第66-69页
致谢	第69-70页
攻读硕士学位期间公开发表的论文和参加的项目	第70页