复杂结构精确Web信息抽取规则语言与关键技术研究

摘要	第6-8页
Abstract	第8-9页
第一章绪论	第13-21页
1.1 Web信息抽取技术的研究背景	第13-14页
1.2 Web信息抽取技术的研究现状和分类	第14-17页
1.3 现有研究工作存在的问题和不足	第17-18页
1.4 本文主要工作	第18-19页
1.5 本文的内容组织	第19-21页
第二章精确Web信息抽取规则体系和模型	第21-33页
2.1 概述	第21页
2.2 精确Web信息抽取全过程模型	第21-24页
2.3 Web取规则体系和基本模型	第24-32页
2.3.1 结构化数据抽取过程模型	第25-26页
2.3.2 页面规则模型	第26-27页
2.3.3 抽取规则包装器生命周期模型	第27-29页
2.3.4 复杂结构Web数据记录模型	第29-32页
2.4 本章小结	第32-33页
第三章基于多特征的层次化抽取规则语言的设计	第33-50页
3.1 引言	第33-34页
3.2 数据抽取规则体系	第34-35页
3.3 抽取规则语言的设计	第35-41页
3.3.1 基本框架	第35页
3.3.2 基本元素	第35-37页
3.3.3 语法和语义	第37-39页
3.3.4 基于XML的规则语言架构	第39-41页
3.4 基于抽取规则语言的数据抽取过程	第41-49页
3.5 本章小结	第49-50页
第四章数据抽取规则的检测与维护	第50-62页
4.1 引言	第50-51页
4.2 检测和维护规则的设计	第51-56页
4.2.1 规则模型	第51-53页
4.2.2 规则设计	第53-56页
4.3 维护规则的实现步骤	第56-60页
4.3.1 定位出错层次	第56-57页
4.3.2 选取稳定或扩展性特征	第57页
4.3.3 恢复关键节点	第57-60页
4.4 规则样例	第60-61页
4.5 本章小结	第61-62页
第五章语义支持的抽取规则技术研究	第62-73页
5.1 问题背景	第62-63页
5.2 语义特征及其识别器	第63-64页
5.2.1 语义特征类型	第63页
5.2.2 语义特征识别器	第63-64页
5.3 基于语义的记录抽取方法	第64-69页
5.3.1 问题描述	第64-65页
5.3.2 语义规则设计	第65-68页
5.3.3 规则样例	第68-69页
5.4 基于主题和情感倾向的抽取检测和集成方法	第69-72页
5.4.1 问题描述	第69-70页
5.4.2 语义规则设计	第70-71页
5.4.3 规则样例	第71-72页
5.5 本章小结	第72-73页
第六章原型系统的设计与实现	第73-84页
6.1 抽取规则语言的实现	第73-79页
6.1.1 抽取规则语言实现流程	第73-74页
6.1.2 抽取规则语言的代码框架	第74-75页
6.1.3 抽取规则语言的预编译	第75-78页
6.1.4 抽取规则语言的执行	第78-79页
6.2 系统设计与实现	第79-83页
6.2.1 原型系统的设计	第79-81页
6.2.2 原型系统的界面	第81-83页
6.3 本章小结	第83-84页
第七章实验结果	第84-89页
7.1 数据集选择	第84-85页
7.2 实验结果及其分析	第85-88页
7.3 本章小结	第88-89页
第八章总结与进一步工作	第89-92页
8.1 本文总结	第89-90页
8.2 进一步的研究工作	第90-92页
参考文献	第92-95页
致谢	第95-96页
附录	第96-97页
研究生期间发表和录用的论文	第96页
研究生期间参与的主要科研项目	第96-97页