面向数字旅游网页的Web信息抽取技术研究

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-11页
·课题背景	第7页
·研究发展现状	第7-9页
·国外发展现状	第7-8页
·国内发展现状	第8-9页
·论文研究内容	第9-10页
·论文组织结构	第10-11页
第二章数字旅游和信息抽取	第11-23页
·数字旅游	第11-12页
·数字旅游概述	第11页
·国内外数字旅游发展现状	第11-12页
·信息抽取技术	第12-14页
·信息抽取技术概述	第12-13页
·Web 信息抽取技术	第13-14页
·Web 信息抽取的方法	第14-19页
·基于自然语言处理方式的 Web 信息抽取	第14-15页
·基于包装器归纳方式的 Web 信息抽取	第15-16页
·基于 Ontology 方式的 Web 信息抽取	第16-17页
·基于 HTML 结构方式的 Web 信息抽取	第17-18页
·基于 WEB 查询方式的 Web 信息抽取	第18-19页
·Web 信息抽取的体系结构	第19-21页
·信息抽取技术的评价指标	第21-22页
·本章小结	第22-23页
第三章信息抽取相关技术研究	第23-33页
·HTML	第23-27页
·HTML 简介	第23-24页
·标记语法和文档结构	第24-26页
·超链和 URL	第26-27页
·XML	第27-28页
·XPath	第28-29页
·数据转换技术	第29页
·正则表达式	第29-31页
·正则表达式简介	第29-30页
·正则表达式的常用举例	第30-31页
·本章小结	第31-33页
第四章基于 DOM 的 Web 信息抽取技术	第33-45页
·网页内容分析方法	第33-34页
·DOM 模型	第34-38页
·DOM 简介	第34-35页
·HTML 文档的树模型	第35-36页
·文档树结构的编程接口	第36-38页
·基于 DOM 的抽取规则	第38-40页
·基于绝对路径的抽取规则	第38页
·基于相对路径的抽取规则	第38-40页
·特征比较法的信息抽取	第40-42页
·基于 DOM 的信息抽取算法	第42-43页
·本章小结	第43-45页
第五章系统的设计与实现	第45-59页
·系统的总体设计	第45-49页
·总体设计思想	第45-46页
·设计流程图	第46-47页
·系统功能模块	第47-49页
·系统的实现	第49-54页
·页面清洗	第49-50页
·文档解析及 DOM 树的构建	第50-51页
·抽取规则的算法与实现	第51-53页
·信息抽取	第53-54页
·信息存储	第54页
·系统功能分析	第54-56页
·系统性能分析	第56-57页
·本章小结	第57-59页
第六章总结与展望	第59-61页
·研究工作总结	第59页
·趋势与展望	第59-61页
致谢	第61-63页
参考文献	第63-67页