首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于云计算的聚类算法并行化关键技术研究

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-16页
   ·研究背景及意义第11-12页
   ·国内外研究现状第12-14页
   ·论文的结构和主要工作第14页
   ·论文组织结构第14-16页
第2章 MapReduce 技术架构研究第16-27页
   ·MapReduce 简介第16页
   ·MapReduce 的组成第16-18页
   ·MapReduce 的核心功能第18-25页
     ·数据读取过程第18-20页
     ·Map 任务阶段第20页
     ·Shuffle 过程第20-24页
     ·Reduce 任务阶段第24-25页
   ·MapReduce Job 的生命周期第25-26页
   ·本章小结第26-27页
第3章 文本聚类技术并行化策略研究第27-37页
   ·聚类概述第27页
   ·文本聚类技术第27-32页
     ·Web 文本预处理第28-29页
     ·中文分词第29页
     ·特征值选择与降维第29-30页
     ·基于 VSM 的文本表示第30-31页
     ·相似性度量方法第31-32页
   ·基于 k-means 算法的文本聚类技术第32-37页
     ·k-means 算法的基本思想第33-35页
     ·k-means 算法的局限性第35页
     ·已有的 k-means 改进算法的优点与不足第35-37页
第4章 基于 MapReduce 的 pk-means++初始化算法研究第37-49页
   ·k-means++初始化算法基本思想第37-38页
   ·基于 MapReduce 的 pk-means++并行初始化算法设计第38-43页
     ·pk-means++算法设计思想第38-40页
     ·pk-means++的 MapReduce 实现第40-43页
   ·实验与分析第43-49页
     ·实验环境第43-44页
     ·实验评价方法和评价基准第44页
     ·实验准备第44页
     ·实验分析第44-47页
     ·实验结论第47-49页
第5章 基于 MapReduce 的文本聚类模型研究第49-62页
   ·聚类模型架构与设计第49-50页
   ·数据预处理模块设计第50-53页
     ·TermConutsInDocument 类的 MapReduce 实现第50-51页
     ·TermSumAndTFInDocuments 类的 MapReduce 实现第51-52页
     ·TermsInCorpusTFIDF 类的 MapReduce 实现第52-53页
     ·DocumentVetorBuid 类的 MapReduce 实现第53页
   ·基于 MapReduce 的 k-means 聚类模块设计第53-56页
   ·实验与结论第56-62页
     ·并行算法的性能评价方法第56页
     ·实验数据第56-58页
     ·实验结果第58-60页
     ·实验结论第60-62页
结论第62-65页
参考文献第65-67页
致谢第67-68页
攻读硕士期间发表(含录用)的学术论文第68页

论文共68页,点击 下载论文
上一篇:面向交互翻译的动态词对齐技术研究及应用
下一篇:基于多策略融合的英汉术语自动翻译技术研究