Web信息抽取规则的优化及规则的XQuery表达
| 第1章 绪论 | 第1-19页 |
| ·研究背景 | 第9-11页 |
| ·研究现状 | 第11-17页 |
| ·基于自然语言处理方式的信息抽取 | 第11-12页 |
| ·包装器归纳方式的信息抽取 | 第12-13页 |
| ·基于ontology方式的信息抽取 | 第13-15页 |
| ·基于HTML结构的信息抽取 | 第15-17页 |
| ·研究目标 | 第17页 |
| ·本章小节 | 第17-19页 |
| 第2章 XPath与XQuery简介 | 第19-28页 |
| ·XML简介 | 第19-20页 |
| ·DOM简介 | 第20-21页 |
| ·XPath简介 | 第21-22页 |
| ·XQuery简介 | 第22-27页 |
| ·本章小节 | 第27-28页 |
| 第3章 原理与方法 | 第28-66页 |
| ·原理概述 | 第28-30页 |
| ·表示模型与语义模型 | 第30-34页 |
| ·表示模型 | 第30页 |
| ·语义模型 | 第30-31页 |
| ·样本页面 | 第31-33页 |
| ·语义模式定义 | 第33-34页 |
| ·规则生成依据分析 | 第34-39页 |
| ·可用的Web页面特征及其适应性 | 第34-36页 |
| ·语义模式结构与Web文档结构的匹配 | 第36-39页 |
| ·抽取规则及其优化 | 第39-65页 |
| ·初始规则 | 第40-46页 |
| ·规则的优化 | 第46-61页 |
| ·规则内部优化 | 第46-58页 |
| ·规则外部优化 | 第58-59页 |
| ·合并规则 | 第59-61页 |
| ·生成基于XQuery的复杂对象抽取规则 | 第61-65页 |
| ·信息抽取 | 第65页 |
| ·本章小节 | 第65-66页 |
| 第4章 原型系统及测试 | 第66-69页 |
| ·原型系统概述 | 第66页 |
| ·测试与性能评价 | 第66-68页 |
| ·本章小节 | 第68-69页 |
| 第5章 结论 | 第69-70页 |
| 参考文献 | 第70-74页 |
| 攻读硕士学位期间科研工作情况 | 第74-75页 |
| 致谢 | 第75页 |