基于本体的旅游领域Web信息抽取
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第1章 绪论 | 第10-18页 |
第1节 研究背景 | 第10页 |
第2节 WEB信息抽取技术 | 第10-14页 |
一、Web 信息抽取的关键技术 | 第10-11页 |
二、Web 信息抽取的方法 | 第11-13页 |
三、信息抽取的评测标准 | 第13-14页 |
第3节 基于本体的信息抽取的研究现状 | 第14-16页 |
第4节 论文研究的内容 | 第16-17页 |
第5节 论文结构 | 第17-18页 |
第2章 领域本体的构建 | 第18-32页 |
第1节 本体知识概述 | 第18-21页 |
一、本体的定义 | 第18页 |
二、本体的构成元素 | 第18-19页 |
三、本体的描述语言 | 第19-21页 |
第2节 本体构建的准则和方法 | 第21-24页 |
一、本体的构建准则 | 第21-22页 |
二、本体的构建方法 | 第22-24页 |
第3节 旅游领域本体的构建 | 第24-30页 |
一、需求分析 | 第24页 |
二、旅游领域重点概念和关系的确定 | 第24-25页 |
三、旅游领域本体的创建 | 第25-30页 |
第4节 使用本体的优势 | 第30-31页 |
第5节 小结 | 第31-32页 |
第3章 本体的推理和解析 | 第32-43页 |
第1节 OWL 和描述逻辑 | 第32-33页 |
第2节 PELLET 推理机 | 第33-35页 |
第3节 本体的推理 | 第35-40页 |
一、Tableaux 算法 | 第35-36页 |
二、SHOIQ(D)-Tableaux 推理算法 | 第36-40页 |
三、旅游本体的推理 | 第40页 |
第4节 本体的解析 | 第40-42页 |
第5节 小结 | 第42-43页 |
第4章 基于本体的WEB 信息抽取技术 | 第43-56页 |
第1节 WEB页面结构特点 | 第43-44页 |
第2节 页面正文提取 | 第44-47页 |
一、DOM 树 | 第44-45页 |
二、网页正文提取算法 | 第45-47页 |
第3节 词法分析 | 第47-52页 |
一、中文分词 | 第47-52页 |
二、停用词过滤 | 第52页 |
第4节 抽取规则 | 第52-55页 |
一、利用属性的语义特点构建抽取规则 | 第53页 |
二、利用三元组构建抽取规则 | 第53-55页 |
第5节 小结 | 第55-56页 |
第5章 广西旅游信息抽取系统的设计与实现 | 第56-64页 |
第1节 开发环境、工具和技术 | 第56-57页 |
第2节 系统的开发背景和体系结构 | 第57页 |
第3节 系统的实现流程 | 第57-60页 |
第4节 性能分析 | 第60-63页 |
第5节 小结 | 第63-64页 |
第6章 总结和展望 | 第64-65页 |
参考文献 | 第65-69页 |
读研期间发表的论文 | 第69-70页 |
致谢 | 第70-71页 |