基于XML的Web信息抽取技术的应用研究

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-12页
·选题背景和意义	第9-10页
·本文的研究内容	第10-11页
·本文结构	第11-12页
第2章 Web信息抽取技术与相关标准	第12-29页
·Web信息抽取技术	第12-16页
·Web信息抽取的概念	第12-13页
·Web信息抽取的关键技术	第13-14页
·现有Web信息抽取的方法和存在的问题	第14-16页
·XML相关技术	第16-29页
·XML介绍	第16-19页
·XHTML介绍	第19-21页
·XML文档访问和DOM	第21-23页
·XPath介绍	第23-24页
·XSLT介绍	第24-29页
第3章基于XML的Web信息抽取的设计和实现	第29-60页
·网页信息抽取的难点和目标	第29-30页
·系统的整体结构与实现	第30-54页
·获取网页	第31-37页
·将数据源映射成 XHTML	第37-49页
·构造DOM树	第49-52页
·数据映射	第52-54页
·系统的改进	第54-60页
·信息熵理论	第55-56页
·构造DOM语义树	第56-58页
·熵值的计算	第58-59页
·匹配信息块	第59-60页
第4章 XML在关系数据库中存储方法的研究	第60-68页
·XML-DBMS概述	第61页
·交换原理	第61-68页
·映射文件的生成	第62-67页
·具体算法的实现	第67-68页
第5章总结和展望	第68-70页
·总结	第68-69页
·展望	第69-70页
参考文献	第70-74页
致谢	第74-75页
作者攻读学位期间发表的论文	第75页