首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量日志分布式处理系统的研究与应用

致谢第1-6页
摘要第6-7页
ABSTRACT第7-10页
1 引言第10-15页
   ·研究背景及意义第10-12页
   ·论文内容第12-13页
   ·论文组织第13-15页
2 Hadoop平台及聚类算法简介第15-25页
   ·Hadoop平台第15-17页
     ·HDFS体系架构-命名节点和数据节点第15-16页
     ·MapReduce编程模型-Jobtracker和Tasktacker第16页
     ·MapReduce编程模型-MapTask/ReduceTask调度第16-17页
   ·海量数据预处理模型框架第17-20页
     ·MapReduce数据预处理第17-19页
     ·提取特征向量第19-20页
   ·聚类算法第20-24页
     ·K-MEANS算法第21页
     ·Mahout中K-MEANS算法第21-23页
     ·K-MEANS算法分析计费日志第23-24页
   ·本章小结第24-25页
3 系统优化第25-40页
   ·常见优化方法第25-26页
   ·导入数据效率优化第26-33页
     ·数据导入机制第27-29页
     ·优化后导入机制第29-33页
   ·数据处理/分析效率优化第33-39页
     ·Map/Reduce执行流程第33-34页
     ·数据处理效率优化第34-37页
     ·K-MEANS聚类分析效率优化第37-39页
   ·本章小结第39-40页
4 基于myHadoop的校园网用户访问日志分析系统设计与实现第40-46页
   ·myHadoop第40-41页
     ·myHadoop开发环境第40-41页
   ·系统总体设计第41-45页
     ·系统分析架构第41-42页
     ·系统部署架构第42-43页
     ·系统模块设计第43-45页
   ·本章小结第45-46页
5 实验测试与分析第46-55页
   ·实验计费日志数据集第46页
   ·实验测试环境第46-48页
     ·完全分布式部署第47-48页
   ·测试结果与分析第48-55页
     ·聚类结果展示第48-51页
     ·数据导入效率测试第51-53页
     ·K-MEANS聚类分析效率测试第53-55页
6 结束语第55-57页
   ·论文总结第55页
   ·下一步的工作方向第55-57页
参考文献第57-59页
附录A第59-63页
附录B第63-65页
作者简历第65-67页
学位论文数据集第67页

论文共67页,点击 下载论文
上一篇:基于点云的曲面重建技术研究
下一篇:媒体检索中近邻关系可逆性问题的研究