基于视觉特征的Web页面信息抽取算法
| 第一章 引言 | 第1-12页 |
| ·互联网的发展带来的信息膨胀 | 第8-12页 |
| 第二章 Web页面分析技术的发展 | 第12-17页 |
| ·信息抽取领域和信息检索领域的发展 | 第12-13页 |
| ·坐标分析法 | 第13-14页 |
| ·基于视觉的页面分割算法 | 第14页 |
| ·模板化网页主题信息的提取方法 | 第14-16页 |
| ·现有分析方法的总结 | 第16-17页 |
| 第三章 基于视觉特征的Web页面信息抽取模型 | 第17-25页 |
| ·简介 | 第17-19页 |
| ·Web页面结构分析介绍 | 第17-18页 |
| ·基于视觉特征的Web页面信息抽取算法概述 | 第18-19页 |
| ·相关工作 | 第19-20页 |
| ·基于视觉的网页内容结构 | 第20-22页 |
| ·基本定义 | 第20页 |
| ·基本模型 | 第20-22页 |
| ·模型示例 | 第22-25页 |
| 第四章 基于视觉特征的Web页面信息抽取算法 | 第25-39页 |
| ·算法概述 | 第25-28页 |
| ·简化DON节点 | 第28-32页 |
| ·视觉块的提取 | 第32-33页 |
| ·参数调整 | 第33-37页 |
| ·总结 | 第37-39页 |
| 第五章 基于视觉特征的Web页面信息抽取模板 | 第39-50页 |
| ·模板概述 | 第39-42页 |
| ·模板模型 | 第42-45页 |
| ·节点信息存储 | 第42-45页 |
| ·模板算法 | 第45-46页 |
| ·模板应用 | 第46-50页 |
| ·从简化DOM模型直接获取块内容 | 第46-48页 |
| ·从视觉块树中提取多部分内容 | 第48-50页 |
| 第六章 实际应用 | 第50-53页 |
| ·搜索引擎中的应用 | 第50-51页 |
| ·采编系统中的应用 | 第51-53页 |
| 第七章 算法性能分析总结与展望 | 第53-56页 |
| ·性能 | 第53页 |
| ·正确率 | 第53页 |
| ·自动化特性 | 第53-54页 |
| ·总结 | 第54页 |
| ·展望 | 第54-56页 |
| 致谢 | 第56-57页 |
| 参考文献 | 第57-59页 |