基于AJAX的Web信息抽取技术的研究

摘要	第3-4页
Abstract	第4页
第1章绪论	第8-11页
1.1 选题的背景及意义	第8-9页
1.2 Web信息抽取的研究现状及发展	第9页
1.3 论文研究内容及组织结构	第9-11页
第2章 Web信息抽取概述	第11-15页
2.1 Web信息抽取原理	第11-12页
2.1.1 传统的信息抽取原理	第11页
2.1.2 基于AJAX的动态网页抽取原理	第11-12页
2.2 Web信息抽取分类	第12-14页
2.2.1 人工获取规则处理方式的信息抽取	第12页
2.2.2 半自动化学习方式的信息抽取	第12-13页
2.2.3 及其学习与归纳学习方式的信息抽取	第13-14页
2.3 信息抽取系统的评价指标	第14页
2.4 本章小结	第14-15页
第3章基于AJAX的信息抽取系统的设计	第15-25页
3.1 相关概念	第15-20页
3.1.1 AJAX	第15-17页
3.1.2 Web2.0	第17-20页
3.1.3 JavaScript	第20页
3.2 传统的信息抽取方式面临的挑战	第20-21页
3.2.1 AJAX资源的不可见性	第21页
3.2.2 状态信息的不可定位性	第21页
3.3 AJAX面临的挑战	第21-22页
3.4 AJAX信息抽取系统的核心工作	第22页
3.5 AJAX信息抽取系统的设计	第22-24页
3.5.1 整体研究思路	第22-23页
3.5.2 整体设计思路	第23页
3.5.3 系统工作流程图	第23-24页
3.6 本章小结	第24-25页
第4章基于AJAX的信息抽取系统的实现	第25-49页
4.1 相关技术	第25-32页
4.1.1 HTML	第25页
4.1.2 XML	第25-28页
4.1.3 XPath	第28页
4.1.4 XSLT	第28-29页
4.1.5 DOM	第29-32页
4.2 页面获取	第32-33页
4.3 页面处理	第33-39页
4.3.1 动态网页处理引擎的工作原理	第34-38页
4.3.2 动态网页处理引擎工作流程	第38-39页
4.4 抽取规则的学习	第39-44页
4.4.1 获取XPath路径	第39-40页
4.4.2 XSLT描述规则	第40-41页
4.4.3 抽取规则的生成	第41-43页
4.4.4 抽取规则的优化	第43-44页
4.5 信息抽取	第44页
4.6 基于DOM的Xpath生成技术	第44-48页
4.6.1 DOM采用JTree显示	第45-46页
4.6.2 基于DOM的XPath生成算法	第46-48页
4.7 本章小结	第48-49页
第5章实验及分析	第49-57页
5.1 开发平台和工具	第49页
5.2 系统工作总览	第49-50页
5.3 用户界面介绍	第50-54页
5.4 抽取实例及分析	第54-55页
5.5 系统评价	第55-56页
5.6 本章小结	第56-57页
第6章总结及展望	第57-59页
6.1 论文总结	第57-58页
6.2 工作展望	第58-59页
致谢	第59-60页
参考文献	第60-64页
攻读硕士学位期间发表的学术论文	第64页