首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于链接相似性分析的WEB结构挖掘方法研究

摘要第5-7页
ABSTRACT第7-8页
目录第9-12页
第1章 绪论第12-33页
    1.1 研究背景和意义第12页
    1.2 研究现状第12-30页
        1.2.1 链接预测技术第13-17页
        1.2.2 搜索引擎作弊检测技术第17-21页
        1.2.3 WEB 数据挖掘技术第21-23页
        1.2.4 WEB 聚类方法第23-30页
    1.3 本文的研究内容第30-31页
    1.4 本文的组织结构第31-33页
第2章 基于相似性的多路径游走链接预测算法第33-53页
    2.1 基于相似性的链接预测研究现状第33-37页
        2.1.1 基于局部信息的相似性指数第34-35页
        2.1.2 基于路径的相似性指数第35-36页
        2.1.3 基于随机游走的相似性指数第36-37页
    2.2 Web 网络模型及结构特征第37-40页
        2.2.1 Web 网络模型第37-38页
        2.2.2 主要结构特征第38-40页
    2.3 基于相似性的多路径游走链接预测算法第40-43页
        2.3.1 相似度计算方法第40-42页
        2.3.2 MW 算法过程描述及实现第42-43页
        2.3.3 MW 算法分析第43页
    2.4 实验分析第43-51页
        2.4.1 实验数据集第44-45页
        2.4.2 实验内容及方案第45页
        2.4.3 实验结果及分析第45-51页
    2.5 本章小结第51-53页
第3章 基于页面互链接相似度聚类的 Spam 页面识别算法第53-69页
    3.1 链接作弊检测技术研究现状第53-57页
    3.2 基于链接结构的 Spam 页面过滤算法及其优缺点分析第57-59页
        3.2.1 基于链接结构的 Spam 页面过滤算法描述第58页
        3.2.2 算法优缺点分析第58-59页
    3.3 基于页面互链接相似度聚类的 Spam 页面识别算法第59-63页
        3.3.1 LSCB-SR 算法思想第59-60页
        3.3.2 基于页面互相链接的相似度第60-62页
        3.3.3 LSCB-SR 算法描述第62-63页
    3.4 实验分析第63-68页
        3.4.1 实验设置第63-64页
        3.4.2 实例分析第64-68页
    3.5 本章小结第68-69页
第4章 基于链接文本相似度的 PageRank 算法研究第69-82页
    4.1 PageRank 算法及其扩展算法第69-73页
        4.1.1 PageRank 算法第69-71页
        4.1.2 TH-PageRank 算法第71页
        4.1.3 MP-PageRank 算法第71-72页
        4.1.4 HillTop 算法第72-73页
    4.2 基于链接文本相似度的改进 PageRank 算法第73-76页
        4.2.1 链接文本第73-74页
        4.2.2 相似度计算第74页
        4.2.3 时间反馈第74-75页
        4.2.4 算法描述第75页
        4.2.5 PageRank 值计算第75-76页
    4.3 实验与分析第76-80页
        4.3.1 实验数据来源第76-77页
        4.3.2 数据处理第77页
        4.3.3 结果分析第77-80页
    4.4 本章小结第80-82页
第5章 基于节点属性标签传播算法的网页聚类技术研究第82-105页
    5.1 标签传播算法研究现状第83-84页
    5.2 LPA 算法及改进的 LPA-SNA 算法第84-90页
        5.2.1 LPA 算法基本思想第84页
        5.2.2 LPA 算法过程描述第84-86页
        5.2.3 问题描述第86-87页
        5.2.4 节点属性相似度第87-89页
        5.2.5 LPA-SNA 算法过程描述第89-90页
    5.3 LPA-SNA 算法实现及分析第90-94页
        5.3.1 LPA-SNA 算法实现第90-92页
        5.3.2 LPA-SNA 算法分析第92-94页
    5.4 簇结构的定量化描述——模块度函数 Q第94-95页
    5.5 实验分析第95-104页
        5.5.1 对比分析第95-102页
        5.5.2 实例分析第102-104页
    5.6 本章小结第104-105页
结论第105-107页
参考文献第107-116页
攻读博士学位期间发表的论文和取得的科研成果第116-117页
致谢第117页

论文共117页,点击 下载论文
上一篇:中国海事请求保全制度正当性研究
下一篇:Smith单相电动机运行性能分析与控制方法研究