基于XML的Web信息抽取技术的应用研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-12页 |
·选题背景和意义 | 第9-10页 |
·本文的研究内容 | 第10-11页 |
·本文结构 | 第11-12页 |
第2章 Web信息抽取技术与相关标准 | 第12-29页 |
·Web信息抽取技术 | 第12-16页 |
·Web信息抽取的概念 | 第12-13页 |
·Web信息抽取的关键技术 | 第13-14页 |
·现有Web信息抽取的方法和存在的问题 | 第14-16页 |
·XML相关技术 | 第16-29页 |
·XML介绍 | 第16-19页 |
·XHTML介绍 | 第19-21页 |
·XML文档访问和DOM | 第21-23页 |
·XPath介绍 | 第23-24页 |
·XSLT介绍 | 第24-29页 |
第3章 基于XML的Web信息抽取的设计和实现 | 第29-60页 |
·网页信息抽取的难点和目标 | 第29-30页 |
·系统的整体结构与实现 | 第30-54页 |
·获取网页 | 第31-37页 |
·将数据源映射成 XHTML | 第37-49页 |
·构造DOM树 | 第49-52页 |
·数据映射 | 第52-54页 |
·系统的改进 | 第54-60页 |
·信息熵理论 | 第55-56页 |
·构造DOM语义树 | 第56-58页 |
·熵值的计算 | 第58-59页 |
·匹配信息块 | 第59-60页 |
第4章 XML在关系数据库中存储方法的研究 | 第60-68页 |
·XML-DBMS概述 | 第61页 |
·交换原理 | 第61-68页 |
·映射文件的生成 | 第62-67页 |
·具体算法的实现 | 第67-68页 |
第5章 总结和展望 | 第68-70页 |
·总结 | 第68-69页 |
·展望 | 第69-70页 |
参考文献 | 第70-74页 |
致谢 | 第74-75页 |
作者攻读学位期间发表的论文 | 第75页 |