首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的高性能文本聚类算法的设计与实现

摘要第1-9页
Abstract第9-10页
1 绪论第10-14页
   ·课题的研究背景和意义第10-11页
   ·课题研究的动机和目的第11-12页
   ·论文的主要内容第12页
   ·论文的组织和结构第12-14页
2 文本聚类算法综述第14-24页
   ·聚类的定义第14页
   ·聚类算法的性能要求第14-15页
   ·文本聚类及其一般流程第15-16页
   ·文本聚类相关技术第16-19页
     ·中文分词第16-17页
     ·文本表示第17-18页
     ·文本相似度计算第18-19页
     ·类间距离度量第19页
   ·文本聚类算法第19-23页
     ·基于划分的聚类算法第20页
     ·基于层次的聚类算法第20-21页
     ·基于密度的聚类算法第21-22页
     ·基于网格的聚类算法第22页
     ·基于模型的聚类算法第22-23页
   ·本章小结第23-24页
3 Hadoop 平台概述第24-33页
   ·云计算平台概述第24页
   ·分布式系统概述第24页
   ·Hadoop 分布式系统第24-25页
   ·Hadoop 总体架构第25-26页
   ·Hadoop 分布式文件系统—HDFS第26-30页
     ·HDFS 的体系结构第26-28页
     ·HDFS 的基本操作第28-29页
     ·HDFS 的数据管理方面的功能第29-30页
   ·MapReduce 编程模型第30-32页
   ·本章小结第32-33页
4 分布式文本聚类算法的设计第33-39页
   ·分布式文本聚类需求分析第33-34页
   ·算法设计的整体思想第34页
   ·功能模块设计第34-37页
     ·数据预处理模块第34-35页
     ·构建空间向量模型模块第35页
     ·构建倒排表和反倒排表模块第35-36页
     ·基于划分的初步聚类模块第36-37页
     ·基于层次的二次聚类模块第37页
   ·本章小结第37-39页
5 分布式文本聚类算法的实现第39-50页
   ·MapReduce 程序模型第39-41页
   ·文本数据预处理第41-42页
   ·构建向量空间模型第42-44页
   ·构建倒排表第44-45页
   ·构建反倒排表第45-46页
   ·基于划分的初步聚类第46-48页
   ·基于层级的聚类第48-49页
   ·本章小结第49-50页
6 分布式文本聚类算法的应用与评估第50-60页
   ·基于 Hadoop 分布式平台的搭建第50-54页
     ·平台搭建环境第50页
     ·Hadoop 分布式平台的搭建第50-51页
     ·Hadoop 分布式平台环境配置第51-54页
   ·集群的初步测试第54-55页
   ·应用数据来源第55页
   ·应用测试结果和分析第55-59页
   ·本章小结第59-60页
总结与展望第60-62页
参考文献第62-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:云计算任务调度算法的研究与实现
下一篇:基于Zig-zag和DWT的数字水印算法研究