首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向数字旅游网页的Web信息抽取技术研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·课题背景第7页
   ·研究发展现状第7-9页
     ·国外发展现状第7-8页
     ·国内发展现状第8-9页
   ·论文研究内容第9-10页
   ·论文组织结构第10-11页
第二章 数字旅游和信息抽取第11-23页
   ·数字旅游第11-12页
     ·数字旅游概述第11页
     ·国内外数字旅游发展现状第11-12页
   ·信息抽取技术第12-14页
     ·信息抽取技术概述第12-13页
     ·Web 信息抽取技术第13-14页
   ·Web 信息抽取的方法第14-19页
     ·基于自然语言处理方式的 Web 信息抽取第14-15页
     ·基于包装器归纳方式的 Web 信息抽取第15-16页
     ·基于 Ontology 方式的 Web 信息抽取第16-17页
     ·基于 HTML 结构方式的 Web 信息抽取第17-18页
     ·基于 WEB 查询方式的 Web 信息抽取第18-19页
   ·Web 信息抽取的体系结构第19-21页
   ·信息抽取技术的评价指标第21-22页
   ·本章小结第22-23页
第三章 信息抽取相关技术研究第23-33页
   ·HTML第23-27页
     ·HTML 简介第23-24页
     ·标记语法和文档结构第24-26页
     ·超链和 URL第26-27页
   ·XML第27-28页
   ·XPath第28-29页
   ·数据转换技术第29页
   ·正则表达式第29-31页
     ·正则表达式简介第29-30页
     ·正则表达式的常用举例第30-31页
   ·本章小结第31-33页
第四章 基于 DOM 的 Web 信息抽取技术第33-45页
   ·网页内容分析方法第33-34页
   ·DOM 模型第34-38页
     ·DOM 简介第34-35页
     ·HTML 文档的树模型第35-36页
     ·文档树结构的编程接口第36-38页
   ·基于 DOM 的抽取规则第38-40页
     ·基于绝对路径的抽取规则第38页
     ·基于相对路径的抽取规则第38-40页
   ·特征比较法的信息抽取第40-42页
   ·基于 DOM 的信息抽取算法第42-43页
   ·本章小结第43-45页
第五章 系统的设计与实现第45-59页
   ·系统的总体设计第45-49页
     ·总体设计思想第45-46页
     ·设计流程图第46-47页
     ·系统功能模块第47-49页
   ·系统的实现第49-54页
     ·页面清洗第49-50页
     ·文档解析及 DOM 树的构建第50-51页
     ·抽取规则的算法与实现第51-53页
     ·信息抽取第53-54页
     ·信息存储第54页
   ·系统功能分析第54-56页
   ·系统性能分析第56-57页
   ·本章小结第57-59页
第六章 总结与展望第59-61页
   ·研究工作总结第59页
   ·趋势与展望第59-61页
致谢第61-63页
参考文献第63-67页

论文共67页,点击 下载论文
上一篇:基于避免交集型歧义的最大匹配算法改进的研究与实现
下一篇:基于GPU的概念格合并算法研究