首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Map-Reduce分布式日志信息处理研究与实现

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-14页
   ·课题来源及意义第8-9页
   ·与本课题有关的国内外研究状况第9-13页
     ·数据挖掘研究现状第9-10页
     ·分布式计算研究现状第10-11页
     ·云计算平台介绍第11-13页
   ·本文研究的内容和安排第13-14页
第二章 hadoop技术介绍第14-20页
   ·hadoop整体架构第14-17页
     ·HDFS第14-15页
     ·MapReduce第15-17页
   ·hadoop应用第17-19页
     ·hbase第17-18页
     ·hive第18页
     ·mahout第18-19页
   ·本章总结第19-20页
第三章 基于hadoop的日志信息处理第20-31页
   ·web日志的内容第20-24页
     ·基本概念第21-22页
     ·web日志信息预处理过程第22-24页
       ·数据清洗第22页
       ·用户识别第22-23页
       ·会话识别第23页
       ·补充路径第23-24页
   ·hadoop处理数据操作第24-31页
     ·数据抽取与求和统计操作第24-26页
       ·数据抽取第24-25页
       ·求和统计功能第25-26页
     ·基于map-reduce的join操作第26-31页
       ·默认join方式第26-28页
       ·map join方式第28页
       ·改进后join方式第28-31页
第四章 基于map-reduce的聚类第31-45页
   ·聚类介绍第31页
   ·聚类方法分类第31-35页
     ·划分聚类第32页
     ·层次聚类第32-33页
     ·基于密度的聚类第33-34页
     ·其他聚类算法第34-35页
   ·模糊理论第35-36页
     ·模糊集合第35页
     ·模糊关系第35-36页
   ·模糊聚类第36-40页
     ·模糊C均值聚类第36-38页
     ·模糊自组织映射神经网络聚类算法第38-40页
       ·自组织特征映射神经网络第38-39页
       ·模糊自组织特征映射网络第39-40页
   ·分布式聚类第40-44页
     ·基于map-reduce模糊C均值聚类第41-43页
     ·基于map-reduce模糊自组织特征映射网络聚类第43-44页
   ·本章总结第44-45页
第五章 基于map-reduce的web日志数据处理系统实现第45-49页
   ·系统环境第45页
   ·系统实现流程第45-48页
     ·日志信息收集第45-46页
     ·预处理第46-47页
     ·聚类操作第47-48页
   ·本章小结第48-49页
第六章 结束语第49-50页
   ·总结第49页
   ·进一步工作第49-50页
参考文献第50-52页
致谢第52-53页
作者攻读学位期间发表的学术论文目录第53页

论文共53页,点击 下载论文
上一篇:融合网络环境中语义UDDI关键技术的研究及实现
下一篇:结构化P2P系统的负载均衡策略的研究