首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Mahout的聚类算法的研究

摘要第1-7页
Abstract第7-11页
第一章 绪论第11-16页
   ·研究背景第11-12页
   ·国内外研究现状第12-13页
     ·国内研究现状第12页
     ·国外研究现状第12-13页
   ·研究内容、创新点和论文结构第13-16页
     ·研究内容第13-14页
     ·论文创新点第14页
     ·论文结构第14-16页
第二章 Hadoop 技术框架研究第16-28页
   ·Hadoop 简介第16-18页
     ·Hadoop 概况第16-17页
     ·Hadoop 子项目第17页
     ·Hadoop 优势第17-18页
   ·MapReduce 计算模型第18-21页
     ·MapReduce 编程模式第18-19页
     ·MapReduce 执行流程第19-20页
     ·MapReduce 容错机制第20-21页
   ·HDFS 分布式文件系统第21-23页
     ·HDFS 主要特性第21-22页
     ·HDFS 体系结构第22-23页
     ·HDFS 容错机制第23页
   ·Mahout 简介第23-25页
     ·Mahout 概况第23-24页
     ·Mahout 算法库第24-25页
   ·Hadoop 与 MPI 的比较第25-27页
     ·不同学科学者的选择第25-26页
     ·Hadoop 与 MPI 在数据处理上的对比第26-27页
   ·本章小结第27-28页
第三章 并行策略研究第28-41页
   ·聚类算法第28-29页
   ·Mahout 数据模型第29-34页
     ·向量表示第29页
     ·相似度计算第29-31页
     ·将数据转化为向量第31-32页
     ·将文本转化为向量第32-34页
   ·基于 MapReduce 的 K-means 算法并行研究第34-40页
     ·K-means 算法思想第34-35页
     ·K-means 算法流程第35-36页
     ·基于 MapReduce 的 K-means 算法并行设计第36-40页
       ·算法并行可行性分析第36-37页
       ·算法并行设计第37-40页
       ·算法时间复杂度第40页
   ·本章小结第40-41页
第四章 实验与分析第41-59页
   ·实验平台第41-42页
     ·硬件环境第41页
     ·软件环境第41-42页
   ·实验一:文档聚类第42-47页
     ·数据预处理第42-44页
     ·实验过程第44-45页
     ·实验结果分析第45-47页
   ·实验二:算法优化及比较第47-57页
     ·优化 K-means 算法第47-53页
       ·Canopy 算法思想第48-49页
       ·Canopy 算法流程第49-50页
       ·Canopy 算法并行化第50-52页
       ·优化 K-means 算法第52-53页
       ·算法时间复杂度第53页
     ·K-means 与 fuzzy c-means 算法的比较第53-54页
     ·实验设计第54-55页
     ·结论与分析第55-57页
   ·实验总结第57-58页
   ·本章小结第58-59页
第五章 结束语第59-61页
   ·论文总结第59-60页
   ·进一步工作第60-61页
参考文献第61-65页
致谢第65-66页
攻读硕士学位期间的研究成果第66页

论文共66页,点击 下载论文
上一篇:高等教育学核心知识研究--以高等教育学专业硕士研究生必读书目为例
下一篇:我国城镇居民住房财富分化的程度、特征及其影响研究