首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于标签树的列表页面数据抽取技术研究

摘要第1-8页
ABSTRACT第8-10页
目录第10-12页
第一章 绪论第12-18页
     ·论文的研究背景及意义第12-14页
     ·国内外研究现状第14-15页
     ·论文的研究内容及创新之处第15-16页
     ·论文的组织结构第16-18页
第二章 Web数据抽取技术的相关概述第18-26页
     ·半结构化数据第18-19页
       ·半结构化数据的定义第18页
       ·半结构化数据的产生原因第18-19页
       ·半结构化数据的特点第19页
     ·Web数据抽取第19-24页
       ·Web数据抽取的定义第19-20页
       ·Web数据抽取技术的产生与发展第20页
       ·Web数据抽取技术的分类第20-22页
       ·Web数据抽取技术的比较分析第22-23页
       ·Web数据抽取技术的未来发展方向第23-24页
     ·列表页面第24-26页
第三章 自动抽取Web数据的树对齐算法第26-35页
     ·引言第26-27页
     ·相关研究第27-28页
     ·树对齐算法第28-32页
     ·实验结果第32-34页
     ·结论第34-35页
第四章 基于标签树的列表页面数据抽取系统的设计、实现与实验第35-68页
     ·基于标签树的列表页面数据抽取系统的设计第35-37页
       ·基于标签树的列表页面数据抽取系统的总体框架第35-36页
       ·基于标签树的列表页而数据抽取系统的基本设计思想第36-37页
     ·基于标签树的列表页面数据抽取系统的实现—模块1:标签树构造第37-41页
       ·HTML页面预处理的重要性及目的第37页
       ·HTML页面的标签树构造算法第37-41页
     ·基于标签树的列表页面数据抽取系统的实现—模块2:主数据区域挖掘第41-50页
       ·涉及的主要概念第41-43页
       ·相似度的计算第43-44页
       ·基于相似度的层次划分思想第44-50页
     ·基于标签树的列表页而数据抽取系统的实现-模块3:数据记录识别第50-52页
       ·数据记录节点的定义第50页
       ·数据记录识别算法第50-52页
     ·基于标签树的列表页面数据抽取系统的实现—模块4:记录模式生成第52-60页
       ·树距离度量标准的介绍第52-54页
       ·基于动态规划的树匹配算法第54-56页
       ·基于树匹配的记录模式生成算法第56-60页
     ·基于标签树的列表页面数据抽取系统的实验第60-68页
       ·评价指标介绍第60-63页
       ·实验设计与性能分析第63-68页
第五章 总结和展望第68-70页
     ·总结第68-69页
     ·展望第69-70页
附录第70-71页
参考文献第71-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:基于变分法的单张带雾图像去噪研究
下一篇:课件色彩咨询系统的研究与实现