基于视觉特征的Web页面信息抽取算法
第一章 引言 | 第1-12页 |
·互联网的发展带来的信息膨胀 | 第8-12页 |
第二章 Web页面分析技术的发展 | 第12-17页 |
·信息抽取领域和信息检索领域的发展 | 第12-13页 |
·坐标分析法 | 第13-14页 |
·基于视觉的页面分割算法 | 第14页 |
·模板化网页主题信息的提取方法 | 第14-16页 |
·现有分析方法的总结 | 第16-17页 |
第三章 基于视觉特征的Web页面信息抽取模型 | 第17-25页 |
·简介 | 第17-19页 |
·Web页面结构分析介绍 | 第17-18页 |
·基于视觉特征的Web页面信息抽取算法概述 | 第18-19页 |
·相关工作 | 第19-20页 |
·基于视觉的网页内容结构 | 第20-22页 |
·基本定义 | 第20页 |
·基本模型 | 第20-22页 |
·模型示例 | 第22-25页 |
第四章 基于视觉特征的Web页面信息抽取算法 | 第25-39页 |
·算法概述 | 第25-28页 |
·简化DON节点 | 第28-32页 |
·视觉块的提取 | 第32-33页 |
·参数调整 | 第33-37页 |
·总结 | 第37-39页 |
第五章 基于视觉特征的Web页面信息抽取模板 | 第39-50页 |
·模板概述 | 第39-42页 |
·模板模型 | 第42-45页 |
·节点信息存储 | 第42-45页 |
·模板算法 | 第45-46页 |
·模板应用 | 第46-50页 |
·从简化DOM模型直接获取块内容 | 第46-48页 |
·从视觉块树中提取多部分内容 | 第48-50页 |
第六章 实际应用 | 第50-53页 |
·搜索引擎中的应用 | 第50-51页 |
·采编系统中的应用 | 第51-53页 |
第七章 算法性能分析总结与展望 | 第53-56页 |
·性能 | 第53页 |
·正确率 | 第53页 |
·自动化特性 | 第53-54页 |
·总结 | 第54页 |
·展望 | 第54-56页 |
致谢 | 第56-57页 |
参考文献 | 第57-59页 |