首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于页面结构的作弊站点识别

摘要第8-10页
ABSTRACT第10-11页
第1章 绪论第12-15页
    1.1 研究背景第12-13页
    1.2 本文研究的主要内容及意义第13-14页
    1.3 本文的主要结构第14-15页
第2章 相关背景知识及问题描述第15-27页
    2.1 常见的搜索引擎排序算法第15-17页
        2.1.1 TF-IDF算法第15-16页
        2.1.2 PageRank算法第16-17页
        2.1.3 HITS算法第17页
    2.2 决策树分类算法第17-19页
    2.3 搜索引擎作弊技术第19-21页
    2.4 搜索引擎反作弊现状第21-26页
        2.4.1 基于内容分析的作弊检测第21-22页
        2.4.2 基于链接分析的作弊检测第22-24页
        2.4.3 基于隐藏技术的作弊检测第24-25页
        2.4.4 基于机器学习的作弊检测第25页
        2.4.5 基于用户行为分析的作弊检测第25-26页
    2.5 本章小结第26-27页
第3章 基于页面结构和样式的模板定义第27-37页
    3.1 引言第27页
    3.2 基于结构的模板定义(DBT:Dom Based Template)第27-32页
        3.2.1 相关定义第28页
        3.2.2 算法设计第28-32页
    3.3 基于样式的模板定义(CBT:Css Based Template)第32-34页
        3.3.1 相关定义第32-33页
        3.3.2 算法设计第33-34页
    3.4 实验和结果第34-36页
        3.4.1 数据集和评测方法第34-35页
        3.4.2 实验结果第35-36页
    3.5 本章小结第36-37页
第4章 基于页面结构的作弊模板识别第37-51页
    4.1 引言第37页
    4.2 DBT同质聚类第37-38页
    4.3 基于用户行为特征的优质页面挖掘第38-44页
        4.3.1 搜索引擎访问日志介绍第39-40页
        4.3.2 特征定义第40-42页
        4.3.3 实验及评测第42-44页
    4.4 基于决策树学习的作弊模板识别第44-47页
        4.4.1 特征抽取第44-47页
        4.4.2 决策树分类第47页
    4.5 实验结果第47-51页
        4.5.1 数据集的获取第47-48页
        4.5.2 实验结果分析第48-51页
第5章 总结与展望第51-53页
    5.1 本文完成的工作第51页
    5.2 下一步工作第51-53页
参考文献第53-59页
致谢第59-60页
攻读学位期间发表的学术论文目录第60-61页
攻读学位期间参加的科研项目第61-62页
学位论文评闽及答辩情况表第62页

论文共62页,点击 下载论文
上一篇:智能控制的可调谐TEA CO2激光器实验研究
下一篇:大功率超声波声场在多层井孔中的径向分布及数值模拟