首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce计算模型的PageRank算法的优化与实现

摘要第4-5页
Abstract第5页
专用术语注释表第8-9页
第一章 绪论第9-14页
    1.1 研究的背景及意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 MapReduce计算模型第10页
        1.2.2 PageRank算法第10-12页
        1.2.3 分布式的PageRank算法第12页
    1.3 论文的组织结构第12-14页
第二章 Web结构挖掘和分布式计算第14-34页
    2.1 链接分析简介第14-16页
        2.1.1 Web图元素组成第14页
        2.1.2 链接分析概念模型第14-16页
    2.2 PageRank算法简介第16-20页
        2.2.1 传统PageRank算法第16-18页
        2.2.2 主题敏感PageRank算法第18-20页
    2.3 HITS算法简介第20-24页
        2.3.1 Hub页面和Authority页面第20-21页
        2.3.2 HITS算法第21-23页
        2.3.3 HITS算法存在的问题第23页
        2.3.4 PageRank算法与HITS算法的比较第23-24页
    2.4 其他链接分析算法第24-25页
        2.4.1 SALSA算法第24页
        2.4.2 Hilltop算法第24-25页
    2.5 分布式计算第25-32页
        2.5.1 Hadoop分布式平台简介第26-27页
        2.5.2 MapReduce计算模型第27-29页
        2.5.3 分布式文件系统第29-31页
        2.5.4 Hadoop的MapReduce工作流程第31-32页
    2.6 本章小结第32-34页
第三章 PageRank算法的优化第34-45页
    3.1 主题漂移现象优化第34-36页
        3.1.1 PageRank算法中的主题漂移现象第34-35页
        3.1.2 对主题漂移现象的改进第35-36页
    3.2 网页权值平均化现象优化第36-37页
        3.2.1 PageRank算法中的网页权值平均化现象第36页
        3.2.2 对网页权值平均化现象的改进第36-37页
    3.3 侧重旧网页现象优化第37页
        3.3.1 PageRank算法中的侧重旧网页现象第37页
        3.3.2 对侧重旧网页现象的改进第37页
    3.4 用户兴趣无关性现象优化第37-39页
        3.4.1 PageRank算法中的用户兴趣无关性现象第37-38页
        3.4.2 对用户兴趣无关性现象的改进第38-39页
    3.5 I-PR算法实验分析第39-44页
        3.5.1 Heritrix爬虫工具和实验数据预处理第39-40页
        3.5.2 实验分析与探究第40-44页
    3.6 本章小结第44-45页
第四章 分布式I-PR算法第45-55页
    4.1 数据的预处理第45-46页
    4.2 Map函数处理第46-47页
    4.3 Combine过程第47-49页
    4.4 Reduce函数处理第49页
    4.5 分布式平台搭建第49-51页
        4.5.1 实验环境的安装和配置第50-51页
        4.5.2 Eclipse开发环境配置第51页
    4.6 实验第51-54页
        4.6.1 实验数据和相关设定第51-52页
        4.6.2 实验过程第52-54页
    4.7 本章小结第54-55页
第五章 总结与展望第55-57页
    5.1 本文的工作总结第55-56页
    5.2 进一步工作展望第56-57页
参考文献第57-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:面向大数据的网络安全分析方法
下一篇:基于多核CPU和GPU的分布式WPA/WPA2-PSK高速破解