首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的Web链接结构分析算法研究

摘要第1-8页
Abstract第8-10页
插图索引第10-11页
附表索引第11-12页
第1章 绪论第12-17页
   ·课题研究背景及意义第12-13页
   ·WEB链接结构分析国内外研究现状第13-15页
   ·课题研究的主要内容第15页
   ·论文的组织结构安排第15-17页
第2章 HADOOP分布式框架技术及平台部署第17-26页
   ·分布式计算技术第17-23页
     ·Hadoop分布式平台简介第17-18页
     ·MapReduce编程模型第18-19页
     ·Hadoop分布式文件系统—HDFS第19-21页
     ·Hadoop的MapReduce工作流程第21-23页
   ·HADOOP平台部署第23-25页
     ·实验环境的安装与配置第23-25页
   ·本章小结第25-26页
第3章 WEB链接结构分析相关理论第26-35页
   ·WEB链接结构理论基础第26-28页
     ·Web结构图研究第26页
     ·从图论方面认识Web链接结构第26-28页
   ·WEB链接结构分析算法—PAGERANK算法第28-29页
     ·PageRank算法第28-29页
     ·PageRank算法存在的问题第29页
   ·WEB链接结构分析算法—HITS算法第29-34页
     ·HITS算法基本思想第29-30页
     ·HITS算法的具体过程第30-32页
     ·HITS算法存在的问题第32-34页
   ·本章小结第34-35页
第4章 PAGERANK算法的优化第35-45页
   ·PAGERANK算法优化方面的研究第35-36页
   ·PAGERANK算法优化计算流程第36-42页
     ·块结构划分第36-38页
     ·构划分PagRank算法第38-42页
   ·实验及其结果分析第42-44页
     ·实验数据集及相关参数设定第42页
     ·实验方案设计第42页
     ·结果分析第42-44页
   ·本章小结第44-45页
第5章 改进的HITS算法第45-56页
   ·传统HITS算法规范化及矩阵存储问题第45-46页
   ·基于MAPREDUCE优化HITS算法的设计方案第46-49页
   ·改进的HITS算法—MAP函数设计第49-51页
   ·改进的HITS算法—REDUCE函数设计第51-52页
   ·实验方案及结果分析第52-55页
     ·实验方案一第52-53页
     ·实验方案二第53-55页
   ·本章小结第55-56页
结论与展望第56-57页
参考文献第57-62页
致谢第62-63页
附录A 攻读硕士学位期间所发表的论文第63页

论文共63页,点击 下载论文
上一篇:多元时间序列数据挖掘中相似性算法的研究
下一篇:基于协同过滤的推荐技术研究