首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

垃圾网页过滤算法及其在搜索引擎中的应用

摘要第5-6页
Abstract第6页
第1章 绪论第11-20页
    1.1 课题研究背景第11-12页
    1.2 国内外发展现状和动态第12-16页
    1.3 Web数据挖掘技术第16-17页
    1.4 课题的研究目的与意义第17-18页
    1.5 本课题的研究内容第18页
    1.6 论文结构第18-20页
第2章 垃圾网页技术第20-27页
    2.1 引言第20页
    2.2 垃圾网页第20-26页
        2.2.1 基于内容的垃圾页面第21-22页
        2.2.2 基于链接的垃圾页面第22-23页
        2.2.3 基于隐藏页面第23页
        2.2.4 决策树算法第23-24页
        2.2.5 排序算法的介绍第24-26页
    2.3 本章小结第26-27页
第3章 垃圾网页检测第27-34页
    3.1 引言第27页
    3.2 页面隐藏技术第27页
    3.3 HTML标签树第27-31页
        3.3.1 文件预处理第27-29页
        3.3.2 HTML文件存放的数据结构第29-31页
    3.4 垃圾网页的检测算法第31-32页
    3.5 实验与结果分析第32-33页
        3.5.1 实验数据第32页
        3.5.2 评价标准第32-33页
        3.5.3 实验结果第33页
    3.6 本章小结第33-34页
第4章 针对垃圾页面的PageRank算法改进第34-48页
    4.1 引言第34页
    4.2 网页基于内容的排序算法第34-35页
    4.3 网页基于主题的排序算法第35-37页
    4.4 PageRank算法第37-39页
        4.4.1 PageRank算法原理第37-38页
        4.4.2 TrustRank算法原理第38-39页
    4.5 抵抗垃圾农场的PageRank算法第39-42页
    4.6 PageRank算法改进第42-47页
        4.6.1 Grade PageRank算法第42-44页
        4.6.2 实验及分析第44-47页
    4.7 本章小结第47-48页
第5章 搜索引擎设计第48-56页
    5.1 引言第48页
    5.2 搜索引擎第48-51页
        5.2.1 搜索引擎技术第48-49页
        5.2.2 搜索引擎分类第49-50页
        5.2.3 搜索引擎工作原理第50页
        5.2.4 搜索引擎的评价标准第50-51页
    5.3 构造搜索引擎的工具介绍第51-52页
        5.3.1 Lucene第51页
        5.3.2 搜索引擎Nutch第51-52页
    5.4 搜索引擎设计第52-53页
        5.4.1 搜索引擎体系结构第52-53页
        5.4.2 系统设计第53页
    5.5 实验分析第53-55页
    5.6 本章小结第55-56页
结论第56-58页
参考文献第58-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:智能枪械管理系统的设计及实现
下一篇:基于非接触卡的指纹识别和身份认证系统设计与实现