首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息抽取技术研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-14页
   ·研究背景和意义第10-11页
   ·Web 信息抽取研究现状第11-12页
     ·国外研究现状第11-12页
     ·国内研究现状第12页
   ·研究内容第12页
   ·结构安排第12-14页
第二章 Web 信息抽取技术概述第14-24页
   ·自由式、结构化和半结构化文本第14-15页
     ·自由文本第14页
     ·结构化文本第14页
     ·半结构化文本第14-15页
   ·Web 网页特点第15-17页
     ·列表页第15-16页
     ·详情页第16-17页
   ·Web 信息抽取分类第17-23页
     ·基于自然语言处理方式的信息抽取第17-18页
     ·基于包装器归纳方式的信息抽取第18-20页
     ·基于本体方式的信息抽取第20-21页
     ·基于HTML 结构的信息抽取第21-23页
     ·基于Web 查询的信息抽取第23页
   ·本章小结第23-24页
第三章 基于XML 的Web 信息抽取相关技术第24-28页
   ·HTML、XHTML 与XML第24页
     ·HTML第24页
     ·XHTML第24页
     ·XML第24页
   ·DOM 模型第24-26页
   ·XPath 介绍第26-27页
     ·轴心第26页
     ·节点测试第26页
     ·谓词第26-27页
   ·XSLT第27页
   ·本章小结第27-28页
第四章 Web 信息抽取的目标与设计第28-33页
   ·Web 信息抽取存在的问题第28-29页
   ·Web 信息抽取的目标第29页
   ·Web 信息抽取的流程设计第29-32页
     ·Web 信息抽取设计思路第29-31页
     ·Web 信息抽取流程第31-32页
   ·本章小结第32-33页
第五章 基于XML 的Web 信息抽取的实现第33-46页
   ·数据预处理第34-39页
     ·页面清洗第35-37页
     ·页面解析第37-39页
   ·抽取规则构造第39-43页
     ·使用JTree 显示XHTML 文档的DOM 树第39-40页
     ·基于DOM 的XPath 生成第40-41页
     ·基于XSLT 的抽取规则生成第41-43页
   ·信息抽取第43-44页
   ·信息抽取性能评估第44-45页
   ·本章小结第45-46页
第六章 总结与展望第46-48页
   ·总结第46页
   ·展望第46-48页
参考文献第48-51页
致谢第51-52页
作者简介第52页

论文共52页,点击 下载论文
上一篇:灌区用水管理图像采集与传输系统研究
下一篇:基于关键词的文本分类研究