首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于视觉特征的网页清洗研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-16页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-13页
    1.3 论文内容与章节安排第13-16页
        1.3.1 论文主要工作第13-14页
        1.3.2 论文组织结构第14-16页
第二章 相关知识第16-24页
    2.1 页面结构表示第16-20页
        2.1.1 HTML第16-18页
        2.1.2 DOM第18-20页
    2.2 页面结构分析第20-24页
第三章 基于视觉信息的页面分块算法第24-36页
    3.1 VIPS(Vision-based Page Segmentation)算法第24-28页
    3.2 视觉分块算法实现第28-36页
        3.2.1 页面视觉块提取算法第29-31页
        3.2.2 自适应调整阈值过程第31-36页
第四章 正文块识别算法第36-45页
    4.1 页面视觉块特征提取第36-40页
        4.1.1 内容特征第37页
        4.1.2 视觉特征第37-39页
        4.1.3 标签特征第39页
        4.1.4 相似度特征第39-40页
    4.2 页面视觉块分类算法第40-45页
        4.2.1 分类算法第40-42页
        4.2.2 样本打标系统第42-45页
第五章 网页清洗系统实现及实验第45-56页
    5.1 网页清洗系统设计与实现第45-49页
    5.2 实验分析第49-53页
        5.2.1 实验评估第49-51页
        5.2.2 自适应调整阈值的分块算法分析第51页
        5.2.3 正文块识别特征选取分析第51-53页
    5.3 对比实验第53-56页
第六章 总结与展望第56-58页
    6.1 本文工作总结第56页
    6.2 进一步工作展望第56-58页
参考文献第58-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于ASAT框架的汉语音节识别系统
下一篇:基于IPV6的P2P僵尸网络研究