基于Agent的Web信息抽取研究

0 前言	第1-11页
·选题背景和意义	第8-9页
·本文工作	第9-10页
·本文结构	第10-11页
1 Web信息抽取概述	第11-20页
·信息抽取与Web信息抽取	第11-12页
·什么是信息抽取	第11页
·信息抽取系统的评测	第11-12页
·什么是Web信息抽取	第12页
·Web信息抽取的应用	第12页
·Internet与Web页面特征	第12-13页
·Web信息抽取系统涉及的关键技术	第13-15页
·抽取规则的生成与表示	第13-14页
·机器学习与Web信息抽取	第14-15页
·学习系统	第14页
·归纳学习方法	第14-15页
·现有的Web信息抽取方法	第15-18页
·基于自然语言处理方式的信息抽取	第15-16页
·基于包装器归纳方式的信息抽取	第16-17页
·包装器机制	第16页
·包装器归纳法	第16-17页
·使用包装器的优缺点与困难	第17页
·基于ontology方式的信息抽取	第17-18页
·基于HTML结构的信息抽取	第18页
·基于Web查询的信息抽取	第18页
·Web信息抽取面临的挑战	第18-20页
2 Agent和XML概述及在Web信息抽取中的应用	第20-27页
·Agent技术概述	第20-23页
·定义和特点	第20页
·Agent与对象	第20-21页
·Agent的构成	第21-22页
·多Agent系统(MAS)	第22页
·Agent的应用领域及应用于Web信息抽取的优点	第22-23页
·XML技术与应用	第23-27页
·XML特点与应用	第23-24页
·XML模式	第24页
·XML文档的访问与DOM	第24-26页
·XML在本文的信息抽取系统中的应用	第26-27页
3 基于Agent的Web信息抽取系统	第27-41页
·系统概述	第27-28页
·系统总目标	第27页
·系统设计基本思想	第27页
·系统总框架	第27-28页
·系统的知识库	第28-37页
·知识的表示方法	第29页
·知识的获取	第29-30页
·领域知识库	第30-33页
·抽取请求库	第33页
·抽取规则库	第33-36页
·语义知识	第34-35页
·页面格式知识与相对路径	第35-36页
·网站信息知识库	第36-37页
·系统中的数据库	第37-39页
·Web页面数据库	第38页
·抽取结果数据库	第38-39页
·系统开发环境	第39-41页
·开发语言--Java	第39页
·开发平台--JADE	第39-40页
·Oracle XML DB	第40-41页
4 系统中Agent功能与实现	第41-58页
·用户接口Agent	第41-43页
·Web页面获取Agent	第43-45页
·信息抽取Agent	第45-50页
·学习抽取规则	第46-49页
·学习抽取规则的方法	第46-48页
·学习抽取规则方法的优缺点	第48-49页
·抽取信息	第49-50页
·包装器的维护	第50页
·Agent之间以及Agent和用户之间的交互与合作	第50-51页
·Agent间的通信方法	第51-58页
·ACL	第51-53页
·KQML	第53-54页
·JADE的Agent通信	第54-55页
·本系统中的Agent通信方案	第55-58页
·设计的依据和出发点	第55页
·本系统Agent通信方法	第55-56页
·本系统ACL	第56-58页
5 实验与总结	第58-63页
·实验介绍	第58-61页
·本文总结	第61页
·进一步的工作	第61-63页
参考文献	第63-65页
致谢	第65-67页