首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于视觉特征的WEB页面信息抽取技术的研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-14页
    1.1 研究背景及意义第9-11页
        1.1.1 研究背景第9-10页
        1.1.2 研究意义第10-11页
    1.2 研究现状第11-12页
    1.3 本文创新点第12-13页
    1.4 论文组织结构第13-14页
第二章 WEB页面信息分析技术的发展第14-27页
    2.1 WEB信息抽取概念第14-15页
    2.2 WEB信息抽取方法第15-22页
        2.2.2 基于包装器的信息抽取第17-19页
        2.2.3 基于Ontology方式的信息抽取第19页
        2.2.4 基于HTML结构的信息抽取第19-22页
        2.2.5 基于页面视觉特征的信息抽取第22页
    2.3 WEB信息抽取的关键技术第22-23页
    2.4 WEB信息抽取系统的评价指标第23-25页
    2.5 WEB 信息抽取存在的问题第25-27页
第三章 基于视觉特征的WEB页面分析技术基础第27-30页
    3.1 WEB页面基于视觉的内容结构描述第27-28页
    3.2 VIPS算法描述第28-29页
    3.3 小结第29-30页
第四章 基于视觉特征的WEB页面信息抽取第30-45页
    4.1 基本定义第31-32页
    4.2 HTML页面生成DOM树第32-33页
    4.3 语义块提取第33-36页
    4.4 分隔条检测第36-38页
    4.5 内容结构构建第38页
    4.6 DR抽取第38-40页
    4.7 主题提取第40-44页
        4.7.1 查找主题算法第41-42页
        4.7.2 抽取主题算法第42-44页
    4.8 小结第44-45页
第五章 实验分析第45-54页
    5.1 实验平台第45页
    5.2 简单实例第45-51页
    5.3 算法性能分析第51-54页
第六章 总结与展望第54-56页
    6.1 总结第54页
    6.2 展望第54-56页
参考文献第56-60页
致谢第60-61页
附录一 作者攻读硕士学位期间发表的论文第61页
附录二 作者攻读硕士学位期间参与的科研项目第61页

论文共61页,点击 下载论文
上一篇:QQ在远程教育中的应用及其传播特性研究
下一篇:复合纳米二氧化钛的改性及在自清洁抗菌氟碳涂料中的应用研究