首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于云计算的Web结构挖掘算法研究

致谢第1-5页
摘要第5-6页
ABSTRACT第6-10页
1 引言第10-14页
   ·研究背景和意义第10-11页
   ·国内外研究现状第11-12页
   ·论文的组织结构第12-14页
2 Web挖掘技术概述第14-24页
   ·Web挖掘的分类第14-16页
     ·Web内容挖掘第15页
     ·Web使用记录挖掘第15页
     ·Web结构挖掘第15-16页
   ·Web结构挖掘第16-18页
     ·Web图概念第16-17页
     ·链接关系表示方法第17-18页
   ·PageRank算法简介第18-24页
     ·算法思想第18-19页
     ·算法分析第19-21页
     ·收敛性评估第21-22页
     ·Pagerank算法的不足和改进第22-24页
3 云计算与MapReduce编程模型第24-38页
   ·计算介绍第24-26页
     ·技术背景第24页
     ·计算概念第24-26页
     ·计算的实现机制第26页
   ·MapReduce技术介绍第26-30页
     ·概念第26-27页
     ·编程原理第27-28页
     ·实现第28-30页
     ·适用条件第30页
   ·Hadoop分布式开源框架第30-33页
     ·概述第30-31页
     ·Hadoop分布式文件系统HDFS第31-33页
   ·Hadoop下Mapreduce的执行原理第33-38页
     ·概述第33-34页
     ·输入与输出第34页
     ·Hadoop-MapReduce的工作流程第34-35页
     ·Hadoop执行中的性能瓶颈第35页
     ·Hadoop-MapReduce的任务调度第35-38页
4 基于Mapreduce的pagerank算法研究第38-54页
   ·算法的来源第38页
   ·基于Mapreduce的Pagerank算法第38-43页
     ·算法数据准备第39-40页
     ·算法实现第40-42页
     ·算法存在的问题和改进第42-43页
   ·利用矩阵分块思想的并行Pagerank算法第43-47页
     ·矩阵分块原理第43页
     ·Web数据集预处理和划分数据块第43-45页
     ·分块算法执行第45-47页
   ·低迭代并行pagerank改进算法第47-54页
     ·算法分析第47-48页
     ·算法实现过程第48-52页
     ·算法的比较和扩展第52-54页
5 实验分析第54-62页
   ·实验数据集第54页
   ·实验平台搭建第54-56页
     ·硬件实验平台第54-55页
     ·Hadoop在集群上配置第55页
     ·Hadoop关键配置项第55-56页
   ·Hadoop下设计Mapreduce的算法第56-57页
   ·在hadoop集群上运行pagerank算法第57-58页
   ·实验结果分析第58-62页
     ·MapReduce并行规模对作业执行时间的影响第58-59页
     ·分析Mapreduce下各pagerank算法时空消耗第59-62页
6 结论与展望第62-64页
   ·本文工作总结第62-63页
   ·展望第63-64页
参考文献第64-66页
作者简历第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:蒙古服饰文化传统在“文革”中的断裂--牧民口述史资料分析
下一篇:铁路客票发售系统灾难备份测试环境的研究与实现