首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于云计算环境的web结构挖掘算法研究

摘要第1-5页
Abstract第5-9页
第1章 引言第9-15页
   ·课题研究的背景及意义第9-11页
   ·课题国内外研究的现状第11-14页
   ·论文各部分的内容安排第14-15页
第2章 云计算平台第15-35页
   ·云计算介绍第15-21页
     ·云计算的提出和发展第15-17页
     ·云计算的特点和分类第17-19页
     ·云计算的研究现状第19-21页
   ·MapReduce编程框架第21-30页
     ·MapReduce模型第22-23页
     ·MapReduce的特点第23-24页
     ·MapReduce的原理第24-26页
     ·MapReduce的具体实现第26-28页
     ·一种基于MapReduce的开源实现——Hadoop框架第28-29页
     ·Hadoop HDFS介绍第29-30页
   ·Hadoop下MapReduce的执行原理第30-34页
     ·概述第30-31页
     ·输入与输出第31页
     ·Hadoop-MapReduce的工作流程第31-32页
     ·Hadoop执行中的性能瓶颈第32-33页
     ·Hadoop-MapReduce的任务调度第33-34页
   ·本章小结第34-35页
第3章 web数据挖掘技术第35-46页
   ·Web数据挖掘概述第35-38页
     ·Web数据挖掘的分类第35-37页
     ·Web数据挖掘的特点第37-38页
     ·Web数据挖掘中的常用技术第38页
   ·PageRank算法简介第38-45页
     ·PageRank算法思想第39-42页
     ·PageRank收敛性评估第42-43页
     ·PageRank算法分析第43-44页
     ·PageRank算法的不足和改进第44-45页
   ·本章小结第45-46页
第4章 基于MapReduce的PageRank算法研究第46-59页
   ·基于MapReduce的PageRank算法来源第46页
   ·基于MapReduce的PageRank并行算法第46-50页
     ·算法的数据准备第46-48页
     ·算法的实现过程第48-50页
     ·算法中的不足和需要改进的地方第50页
   ·基于MapReduce的PageRank改进算法第50-58页
     ·算法的表示第51-52页
     ·算法的实现过程第52-57页
     ·算法的比较和扩展第57-58页
   ·本章小结第58-59页
第5章 实验过程及分析第59-68页
   ·Hadoop环境的部署第59-62页
     ·实验的软硬件环境第59页
     ·Hadoop在集群上配置第59-60页
     ·Hadoop关键配置项第60-62页
   ·实验数据集的准备第62页
   ·Hadoop集群下运行算法第62-63页
   ·实验分析第63-67页
     ·MapReduce并行规模对作业执行时间的影响第63-65页
     ·分析MapReduce下各PageRank算法时空消耗第65-67页
   ·本章小结第67-68页
第6章 总结与展望第68-70页
   ·本论文的主要工作总结第68页
   ·进一步的研究工作第68-70页
致谢第70-71页
参考文献第71-74页
攻读硕士期间参与的项目第74页

论文共74页,点击 下载论文
上一篇:基于关联规则的用户兴趣模型的研究与应用
下一篇:基于多核平台的实时混合任务调度算法研究