基于本体的Web页面结构化信息抽取
摘要 | 第1-6页 |
Abstract | 第6-12页 |
1 绪论 | 第12-18页 |
·引言 | 第12-14页 |
·研究现状及面临的挑战 | 第14-16页 |
·研究内容及意义 | 第16-17页 |
·论文结构 | 第17-18页 |
2 信息抽取概述 | 第18-28页 |
·信息抽取的产生及发展历史 | 第18-21页 |
·信息抽取的模型结构 | 第21-22页 |
·信息抽取的主要任务 | 第22-23页 |
·信息抽取的评价指标 | 第23页 |
·信息抽取的原理分析与比较 | 第23-27页 |
·小结 | 第27-28页 |
3 基于本体的信息抽取理论和方法 | 第28-35页 |
·本体基础知识介绍 | 第28-30页 |
·本体描述语言 OWL | 第30-32页 |
·使用本体的优势 | 第32-33页 |
·基于本体的信息抽取概要 | 第33-34页 |
·小结 | 第34-35页 |
4 基于本体的信息抽取系统的设计 | 第35-52页 |
·原型系统的模型框架结构 | 第35-37页 |
·Web信息抽取规则预定义 | 第37-48页 |
·本体学习以及领域本体的构造 | 第48-50页 |
·Web信息抽取规则的生成 | 第50-51页 |
·小结 | 第51-52页 |
5 系统实现与实验 | 第52-65页 |
·样本页面的获取及处理 | 第53-57页 |
·PAT树编码实现 | 第57-60页 |
·构造领域本体 | 第60-63页 |
·抽取Web信息 | 第63-64页 |
·小结 | 第64-65页 |
6 总结与展望 | 第65-67页 |
致谢 | 第67-68页 |
攻读硕士期间主要成果 | 第68-69页 |
参考文献 | 第69-73页 |
详细摘要 | 第73-85页 |