首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于MapReduce的PageRank计算系统的设计与实现

摘要第5-6页
Abstract第6-7页
目录第8-11页
第1章 绪论第11-15页
    1.1 课题的研究背景第11页
    1.2 国内外研究现状第11-13页
    1.3 本文的研究内容和组织结构第13-15页
第2章 相关技术第15-27页
    2.1 云计算第15-16页
    2.2 Heritrix爬虫第16-18页
    2.3 HDFS第18-20页
    2.4 MapReduce编程模型第20-22页
    2.5 PageRank计算模型第22-23页
    2.6 图数据可视化软件prefuse简介第23-24页
    2.7 Hama介绍第24-26页
    2.8 本章小结第26-27页
第3章 系统的体系结构第27-31页
    3.1 系统的需求设计第27-28页
        3.1.1 系统需求概述第27页
        3.1.2 功能需求第27-28页
        3.1.3 性能需求第28页
    3.2 系统的总体设计第28-30页
    3.3 本章小结第30-31页
第4章 数据爬取与数据预处理第31-43页
    4.1 HERITRIX抓取URL第31-33页
        4.1.1 抓取原理第31页
        4.1.2 抓取流程分析第31-33页
    4.2 节点编号及初始PageRank生成第33-35页
        4.2.1 节点编号背景第33页
        4.2.2 节点编号的算法设计第33-34页
        4.2.3 实验结果第34-35页
    4.3 基于顶点编号的图邻接表生成第35-42页
        4.3.1 图邻接表第35-36页
        4.3.2 图邻接表产生算法第36-39页
        4.3.3 实验结果展示第39-40页
        4.3.4 类型图邻接表算法第40-42页
    4.4 本章小结第42-43页
第5章 PAGERANK计算第43-63页
    5.1 PageRank计算相关背景第43-45页
        5.1.1 PageRank计算公式第43-44页
        5.1.2 计算PageRank的方法第44-45页
    5.2 朴素的计算PageRank算法NativePR第45-50页
    5.3 一次迭代一个Job计算PageRank算法OIOJ-PR第50-51页
    5.4 基于子图划分计算PageRank算法SGPB-PR第51-54页
    5.5 实验结果显示第54页
    5.6 网页排序第54-56页
    5.7 网页连接图可视化第56-61页
        5.7.1 数据加载及格式转化第57-58页
        5.7.2 prefuse可视化显示图的原理第58-59页
        5.7.3 图数据的局部显示第59-60页
        5.7.4 缓存更新第60页
        5.7.5 prefuse作图结果第60-61页
    5.8 本章小结第61-63页
第6章 系统部署及性能评估第63-69页
    6.1 系统部署环境要求第63页
    6.2 系统配置和启动第63-64页
    6.3 运行PageRank程序第64页
    6.4 PageRank程序结果分析第64-68页
    6.5 本章小结第68-69页
第7章 结束语第69-71页
    7.1 本文总结第69页
    7.2 进一步工作以及展望第69-71页
参考文献第71-75页
致谢第75-77页
攻读硕士期间参加的项目和发表的论文第77页

论文共77页,点击 下载论文
上一篇:EtherNet/Ip工业以太网在精致氯化钾生产过程控制系统中的应用研究
下一篇:基于Canny算子结合小波变换和改进Hausdorff距离的医学图像配准算法研究