首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于云计算环境的Web结构挖掘算法研究

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第13-21页
    1.1 引言第13-16页
    1.2 国内外研究现状第16-19页
    1.3 本文的主要研究内容第19页
    1.4 本文的组织结构第19-21页
第2章 相关技术研究第21-29页
    2.1 云计算第21-22页
        2.1.1 云计算产生背景第21页
        2.1.2 云计算概念第21页
        2.1.3 云计算关键技术第21-22页
    2.2 Web挖掘第22-23页
        2.2.1 Web挖掘特点第22-23页
        2.2.2 Web挖掘分类第23页
    2.3 Web结构挖掘第23-25页
        2.3.1 Web图概念第24-25页
        2.3.2 链接关系表示第25页
    2.4 PageRank算法第25-28页
        2.4.1 算法思想第25-27页
        2.4.2 算法优缺点第27-28页
    2.5 本章小节第28-29页
第3章 Hadoop云计算平台分析第29-36页
    3.1 概述第29-32页
        3.1.1 Hadoop概述第29页
        3.1.2 HDFS特点和体系结构第29-30页
        3.1.3 HDFS数据管理第30-31页
        3.1.4 MapReduce介绍第31-32页
    3.2 Hadoop下的MapReduce第32-35页
        3.2.1 工作流程第33页
        3.2.2 调度策略第33-35页
        3.2.3 错误处理机制第35页
    3.3 本章小节第35-36页
第4章 云计算环境下PageRank算法实现第36-54页
    4.1 PageRank算法并行实现第36-45页
        4.1.1 矩阵分块第36-38页
        4.1.2 矩阵存储结构第38页
        4.1.3 PageRank算法内积法并行实现第38-40页
        4.1.4 PageRank算法外积法并行实现第40-42页
        4.1.5 PageRank算法矩阵分块法并行实现第42-44页
        4.1.6 并行实现中存在的问题第44-45页
    4.2 PageRank算法Gauss-Seidel迭代实现第45-47页
        4.2.1 Jacobi迭代法第45页
        4.2.2 Gauss-Seidel迭代法第45-46页
        4.2.3 PageRank算法Gauss-Seidel迭代实验第46-47页
        4.2.4 算法存在的问题第47页
    4.3 利用最小分块方法并行实现PageRank算法第47-53页
        4.3.1 最小分块原理第47-48页
        4.3.2 数据准备第48-50页
        4.3.3 实现过程第50-52页
        4.3.4 复杂度分析第52页
        4.3.5 算法比较第52-53页
    4.4 本章小节第53-54页
第5章 实验与结果分析第54-63页
    5.1 Hadoop平台搭建第54-57页
        5.1.1 角色和运行方式第54页
        5.1.2 实验环境第54页
        5.1.3 Hadoop环境搭建第54-57页
    5.2 数据集准备第57-58页
    5.3 基于MapReduce的并行实现第58-60页
        5.3.1 插件安装第58页
        5.3.2 基于最小分块的PageRank算法开发第58-60页
    5.4 结果分析第60-62页
    5.5 本章小结第62-63页
第6章 总结与展望第63-65页
    6.1 论文总结第63页
    6.2 研究展望第63-65页
参考文献第65-68页
攻读学位期间发表的学术论文目录第68-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:无线传感器网络中安全组密钥管理机制的研究
下一篇:基于测距的无线传感网定位算法的研究