Web信息抽取规则的优化及规则的XQuery表达
第1章 绪论 | 第1-19页 |
·研究背景 | 第9-11页 |
·研究现状 | 第11-17页 |
·基于自然语言处理方式的信息抽取 | 第11-12页 |
·包装器归纳方式的信息抽取 | 第12-13页 |
·基于ontology方式的信息抽取 | 第13-15页 |
·基于HTML结构的信息抽取 | 第15-17页 |
·研究目标 | 第17页 |
·本章小节 | 第17-19页 |
第2章 XPath与XQuery简介 | 第19-28页 |
·XML简介 | 第19-20页 |
·DOM简介 | 第20-21页 |
·XPath简介 | 第21-22页 |
·XQuery简介 | 第22-27页 |
·本章小节 | 第27-28页 |
第3章 原理与方法 | 第28-66页 |
·原理概述 | 第28-30页 |
·表示模型与语义模型 | 第30-34页 |
·表示模型 | 第30页 |
·语义模型 | 第30-31页 |
·样本页面 | 第31-33页 |
·语义模式定义 | 第33-34页 |
·规则生成依据分析 | 第34-39页 |
·可用的Web页面特征及其适应性 | 第34-36页 |
·语义模式结构与Web文档结构的匹配 | 第36-39页 |
·抽取规则及其优化 | 第39-65页 |
·初始规则 | 第40-46页 |
·规则的优化 | 第46-61页 |
·规则内部优化 | 第46-58页 |
·规则外部优化 | 第58-59页 |
·合并规则 | 第59-61页 |
·生成基于XQuery的复杂对象抽取规则 | 第61-65页 |
·信息抽取 | 第65页 |
·本章小节 | 第65-66页 |
第4章 原型系统及测试 | 第66-69页 |
·原型系统概述 | 第66页 |
·测试与性能评价 | 第66-68页 |
·本章小节 | 第68-69页 |
第5章 结论 | 第69-70页 |
参考文献 | 第70-74页 |
攻读硕士学位期间科研工作情况 | 第74-75页 |
致谢 | 第75页 |