首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于云计算环境的web结构挖掘算法研究

摘要第1-5页
Abstract第5-10页
1 引言第10-16页
   ·课题研究的背景和意义第10-13页
   ·课题的国内外研究现状第13-15页
   ·本文的内容组织结构第15-16页
2 web 挖掘技术介绍第16-29页
   ·数据挖掘第16页
   ·web 数据挖掘第16-18页
     ·web 数据挖掘及其分类第16-18页
   ·web 结构挖掘的理论基础第18-22页
     ·web 链接结构及 web 结构挖掘第18-20页
     ·从图论的角度分析 web 链接结构第20-22页
   ·web 结构挖掘 PageRank 算法原理分析第22-29页
     ·PageRank 算法第23-26页
     ·PageRank 算法产生的黑洞现象第26-27页
     ·PageRank 算法存在的不足第27-29页
3 云计算及其关键技术第29-43页
   ·云计算技术介绍第29-33页
     ·云计算的技术提出及发展第29-30页
     ·云计算技术和其基本原理第30-33页
   ·MapReduce 编程框架介绍第33-37页
     ·MapReduce 编程框架的介绍第33页
     ·MapReduce 编程框架的原理第33-34页
     ·MapReduce 编程框架的具体实现第34-36页
     ·MapReduce 编程框架的容错机制第36页
     ·MapReduce 运行时间分析第36-37页
     ·MapReduce 编程框架的使用条件第37页
   ·基于 MapReduce 的开源实现-Hadoop 框架第37-43页
     ·Hadoop 框架概述第37-38页
     ·Hadoop 文件分布式系统-HDFS第38-40页
     ·MapReduce 下的 Hadoop 具体实现第40-41页
     ·MapReduce 下的 Hadoop 的工作流程第41-42页
     ·Hadoop 性能的不足之处第42-43页
4 基于 MapReduce 的 PageRank 算法研究第43-62页
   ·基于 MapReduce 的 PageRank 算法来源第43页
   ·MapReduce 下 PageRank 并行算法第43-48页
     ·基于 MapReduce 下的 PageRank 算法数据准备第43-46页
     ·基于 MapReduce 的 PageRank 算法实现过程第46-48页
     ·算法中的不足和需要改进的地方第48页
   ·裁枝算法的提出第48-55页
     ·裁枝算法的算法原理第49-52页
     ·裁枝算法的数据准备第52-53页
     ·裁枝算法的执行过程第53-55页
     ·裁枝算法的优势第55页
   ·邻接矩阵的分块算法第55-62页
     ·矩阵分块算法的实现原理第56-59页
     ·邻接矩阵分块算法的实现第59-60页
     ·分块算法的优势分析第60-62页
5 实验过程及分析第62-69页
   ·Hadoop 环境的部署第62-65页
     ·实验环境的软硬件环境第62-63页
     ·集群节点之间的网络通信-安装 SSH 服务第63页
     ·Hadoop 环境的搭建第63-65页
   ·实验数据集的准备第65页
   ·Hadoop 集群下运行算法第65-66页
   ·实验分析第66-69页
     ·分块算法块的大小对算法效率的影响第66-67页
     ·分析算法的时空消耗第67-69页
6 总结与展望第69-71页
   ·本文总结第69页
   ·展望第69-71页
致谢第71-72页
参考文献第72-77页
攻读硕士学位期间发表及录用的学术论文第77页

论文共77页,点击 下载论文
上一篇:基于FPGA的电脑横机控制系统高速串行总线研制
下一篇:基于P2P的电信营运级视频点播系统开发