首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于hadoop的海量搜索日志分析平台的设计和实现

摘要第1-5页
Abstract第5-9页
1 绪论第9-13页
   ·研究背景及意义第9-10页
   ·国内外相关研究第10-11页
   ·论文主要工作第11-12页
   ·论文结构第12-13页
2 相关技术介绍第13-21页
   ·Hadoop概述第13-18页
     ·Hadoop介绍第13页
     ·HDFS介绍第13-16页
     ·MapReduce介绍第16-18页
   ·Hive概述第18-19页
     ·Hive架构介绍第18-19页
     ·Hive优点第19页
   ·HBase概述第19-21页
3 海量搜索日志分析概述第21-25页
   ·需求分析第21-22页
     ·开发背景与目的第21页
     ·功能需求分析第21-22页
   ·搜索日志常见模型第22-25页
     ·二分图模型第22-23页
     ·图模型第23-24页
     ·随机游走模型第24-25页
4 海量搜索日志分析平台的设计与实现第25-47页
   ·平台总体架构和模块设计第25-26页
   ·平台数据采集预处理模块详细设计第26-31页
     ·数据采集模块第26-29页
     ·数据预处理模块第29-31页
   ·海量日志存储模块详细设计第31-34页
     ·设计目标第31-32页
     ·存储模块的结构设计第32-34页
   ·海量日志分析模块详细设计第34-39页
     ·日志分析计算模型第34-35页
     ·基于用户行为模式挖掘的设计第35-39页
   ·平台监控模块详细设计第39-47页
     ·集群管理器的设计第39-42页
     ·配置管理器的设计第42-47页
5 平台测试与数据分析第47-60页
   ·实验环境配置部署第47-49页
     ·hadoop集群安装部署第47-48页
     ·hive安装配置第48-49页
   ·数据处理第49-56页
     ·数据去重复分析处理第50-51页
     ·搜索结果相似度度量分析第51-52页
     ·查询主题排行分析处理第52-54页
     ·用户点击url排名分析处理第54-56页
   ·实验结果分析第56-59页
     ·查询主题排行榜第56-57页
     ·用户点击数与URL排名第57-58页
     ·查询会话分析第58页
     ·分布式平台效率分析第58-59页
   ·系统优化第59-60页
结论第60-61页
参考文献第61-64页
攻读硕士学位期间发表学术论文情况第64-65页
致谢第65-66页

论文共66页,点击 下载论文
上一篇:基于多任务学习的JPEG图像隐密分析
下一篇:服务器监控系统安全管理模块的设计与实现