首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于本体的旅游领域Web信息抽取

摘要第1-5页
ABSTRACT第5-10页
第1章 绪论第10-18页
 第1节 研究背景第10页
 第2节 WEB信息抽取技术第10-14页
  一、Web 信息抽取的关键技术第10-11页
  二、Web 信息抽取的方法第11-13页
  三、信息抽取的评测标准第13-14页
 第3节 基于本体的信息抽取的研究现状第14-16页
 第4节 论文研究的内容第16-17页
 第5节 论文结构第17-18页
第2章 领域本体的构建第18-32页
 第1节 本体知识概述第18-21页
  一、本体的定义第18页
  二、本体的构成元素第18-19页
  三、本体的描述语言第19-21页
 第2节 本体构建的准则和方法第21-24页
  一、本体的构建准则第21-22页
  二、本体的构建方法第22-24页
 第3节 旅游领域本体的构建第24-30页
  一、需求分析第24页
  二、旅游领域重点概念和关系的确定第24-25页
  三、旅游领域本体的创建第25-30页
 第4节 使用本体的优势第30-31页
 第5节 小结第31-32页
第3章 本体的推理和解析第32-43页
 第1节 OWL 和描述逻辑第32-33页
 第2节 PELLET 推理机第33-35页
 第3节 本体的推理第35-40页
  一、Tableaux 算法第35-36页
  二、SHOIQ(D)-Tableaux 推理算法第36-40页
  三、旅游本体的推理第40页
 第4节 本体的解析第40-42页
 第5节 小结第42-43页
第4章 基于本体的WEB 信息抽取技术第43-56页
 第1节 WEB页面结构特点第43-44页
 第2节 页面正文提取第44-47页
  一、DOM 树第44-45页
  二、网页正文提取算法第45-47页
 第3节 词法分析第47-52页
  一、中文分词第47-52页
  二、停用词过滤第52页
 第4节 抽取规则第52-55页
  一、利用属性的语义特点构建抽取规则第53页
  二、利用三元组构建抽取规则第53-55页
 第5节 小结第55-56页
第5章 广西旅游信息抽取系统的设计与实现第56-64页
 第1节 开发环境、工具和技术第56-57页
 第2节 系统的开发背景和体系结构第57页
 第3节 系统的实现流程第57-60页
 第4节 性能分析第60-63页
 第5节 小结第63-64页
第6章 总结和展望第64-65页
参考文献第65-69页
读研期间发表的论文第69-70页
致谢第70-71页

论文共71页,点击 下载论文
上一篇:安全的人事信息系统开发框架的研究与实现
下一篇:基于CTI技术的电信语音增值业务平台的设计与实现