首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web数据抽取技术的研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·论文的研究背景及意义第9-11页
     ·Web数据抽取的概念及应用场景第9-10页
     ·Web数据抽取面临的问题第10-11页
   ·Web数据抽取的研究现状第11-12页
   ·论文的研究内容第12-13页
   ·论文的内容组织第13-14页
第二章 Web数据抽取相关概述第14-23页
   ·Web数据抽取的形式化定义及过程第14-16页
     ·Web数据抽取的形式化定义第14页
     ·Web数据抽取的过程第14-16页
   ·Web数据抽取技术分类第16-18页
     ·按照自动化程度进行分类第16-17页
     ·按照工作原理进行分类第17-18页
   ·基本概念第18-21页
     ·HTML第18-19页
     ·DOM树第19-20页
     ·XPATH第20-21页
   ·Web数据抽取的评价指标第21-23页
第三章 不规则列表数据抽取技术第23-37页
   ·列表页相关概念第24页
   ·挖掘列表页的数据区域第24-27页
   ·识别数据区域中的数据记录第27-30页
   ·生成数据记录的最大匹配结构第30-34页
     ·对已有标签树匹配算法的改进第30-33页
     ·标签树部分对齐算法第33-34页
   ·基于列表页的Web数据抽取系统的设计与实现第34-37页
第四章 基于内容页的Web数据抽取技术的研究第37-51页
   ·内容页相关概念第37-39页
   ·无结构内容页正文的抽取第39-42页
     ·对网页进行分块第39-41页
     ·内容页的正文块的选取第41-42页
   ·结构型内容页的数据抽取第42-47页
     ·对字符串不匹配的处理第43-44页
     ·对标签不匹配的处理第44-47页
   ·基于内容页的Web数据抽取系统的设计与实现第47-51页
     ·无结构内容页正文抽取系统第47-48页
     ·结构型内容页数据抽取系统第48-51页
第五章 总结第51-52页
   ·本文总结第51页
   ·下一步工作第51-52页
参考文献第52-55页
攻读硕士期间发表的学术论文及主持的项目第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于目标轮廓线的形状描述子及其在植物叶片识别中的应用
下一篇:基于QoS的Web服务组合Pareto推优研究