首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web Spam特征分析及其检测技术研究

摘要第5-8页
Abstract第8-10页
第一章 绪论第11-20页
    1.1 研究背景与意义第11-14页
        1.1.1 研究背景第11-12页
        1.1.2 垃圾网页的分类第12-13页
        1.1.3 垃圾网页数据集的不平衡特性第13-14页
        1.1.4 本项研究的意义第14页
    1.2 本课题研究现状第14-16页
    1.3 问题的提出第16-17页
    1.4 论文研究内容及组织结构第17-20页
        1.4.1 研究内容及创新点第17-18页
        1.4.2 论文组织结构第18-20页
第二章 web spam 内容特征及其相关性分析第20-42页
    2.1 单个内容特征分析第20-27页
        2.1.1 正常网页的单个内容特征第21-26页
        2.1.2 垃圾网页的单个内容特征第26-27页
    2.2 内容特征之间的相关度第27-29页
        2.2.1 两个内容特征之间的相关系数第27-28页
        2.2.2 四个内容特征之间的相关系数第28-29页
    2.3 实验及分析第29-40页
        2.3.1 单个内容特征的概率分布第30-37页
        2.3.2 内容特征间的相关度第37-39页
        2.3.3 实验结果分析第39-40页
    2.4 本章小结第40-42页
第三章 web spam 链接特征研究第42-71页
    3.1 网页的链接特征第42-47页
        3.1.1 基本概念第42-43页
        3.1.2 网页的链接特征及其含义第43-47页
    3.2 网页单个链接特征分析第47-54页
        3.2.1 正常网页的单个链接特征第47-53页
        3.2.2 垃圾网页的单个链接特征第53-54页
    3.3 链接特征组研究第54-56页
        3.3.1 基本概念第54-55页
        3.3.2 网页前驱增长率第55页
        3.3.3 主机前驱增长率第55-56页
        3.3.4 网页截断 PageRank 值第56页
    3.4 实验及分析第56-70页
        3.4.1 单个链接特征的概率分布第57-64页
        3.4.2 链接特征组第64-68页
        3.4.3 实验结果分析第68-70页
    3.5 结论第70页
    3.6 本章小结第70-71页
第四章 基于双向信息反馈的垃圾网页检测第71-87页
    4.1 有向网络链接图第71-72页
        4.1.1 正向网络链接图第71页
        4.1.2 逆向网络链接图第71-72页
    4.2 预备知识第72-73页
        4.2.1 PageRank 算法第72-73页
        4.2.2 TrustRank 算法第73页
    4.3 向前流信息和向后流信息第73-75页
        4.3.1 网页的正分和负分第74页
        4.3.2 向前流信息和向后流信息第74-75页
    4.4 双向趋势信息第75-76页
        4.4.1 正面趋势函数第75页
        4.4.2 负面趋势函数第75-76页
    4.5 出度转换矩阵和入度转换矩阵第76-77页
        4.5.1 出度转换矩阵第76页
        4.5.2 入度转换矩阵第76页
        4.5.3 一个网络子图例子第76-77页
    4.6 种子集选择第77-79页
        4.6.1 好种子集选择第77-78页
        4.6.2 差种子集选择第78-79页
    4.7 双向趋势信息反馈方程式第79-80页
        4.7.1 向前流矩阵和向后流矩阵第79页
        4.7.2 两个传播方程式第79-80页
    4.8 实验及分析第80-86页
        4.8.1 原始数据集第80-81页
        4.8.2 中间结果文件第81-85页
        4.8.3 实验结果第85页
        4.8.4 实验分析第85-86页
    4.9 本章小结第86-87页
第五章 总结与展望第87-91页
    5.1 本文总结第87-89页
        5.1.1 网页内容特征的研究第87-88页
        5.1.2 网页链接特征的研究第88页
        5.1.3 网页特征研究用以分析垃圾网页作弊技术第88-89页
        5.1.4 基于链接的具有双向信息反馈机制的网页排序算法第89页
    5.2 未来研究工作展望第89-90页
        5.2.1 基于语义分析的垃圾网页及垃圾邮件检测第89-90页
        5.2.2 基于双向链接的种子集选择第90页
    5.3 结束语第90-91页
参考文献第91-97页
攻读博士学位期间取得的成果及参与的课题第97-99页
致谢第99页

论文共99页,点击 下载论文
上一篇:层序社会中的师者
下一篇:基于移动数据收集的自组织无线传感器网络传输策略研究