首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大规模数据聚类技术研究与实现

摘要第1-6页
ABSTRACT第6-13页
第一章 绪论第13-16页
   ·引言第13-14页
   ·研究动机第14页
   ·论文的主要工作和成果第14-15页
   ·论文的组织结构第15-16页
第二章 数据聚类相关技术第16-40页
   ·聚类分析概述第16-20页
     ·聚类分析的定义第16-17页
     ·聚类分析中的数据结构和数据类型第17-18页
     ·聚类分析中的距离度量第18-20页
     ·聚类结果评价第20页
   ·聚类基本步骤第20-22页
   ·主要聚类算法第22-32页
     ·划分聚类第22-26页
     ·层次聚类第26-29页
     ·密度聚类第29-30页
     ·基于模型的聚类第30-32页
   ·大规模数据聚类技术第32-39页
     ·顺序聚类第33-36页
     ·基于取样的聚类第36-38页
     ·分布式聚类第38-39页
   ·本章小结第39-40页
第三章 基于并行计算和分布式平台的数据聚类第40-62页
   ·并行计算和分布式平台第40页
   ·基于MPI 并行计算的层次聚类第40-50页
     ·并行计算与MPI 简介第41-44页
     ·一个单机层次聚类算法第44-46页
     ·基于MPI 的并行层次聚类第46-48页
     ·试验与评估第48-50页
   ·基于HADOOP 平台的CANOPY-KMEANS 聚类第50-61页
     ·Hadoop 分布式计算平台第50-53页
     ·Canopy-kmeans 聚类原理第53-55页
     ·Canopy-kmeans 执行流程第55-59页
     ·试验与评估第59-61页
   ·本章小结第61-62页
第四章 一个可扩展聚类系统的设计与实现第62-84页
   ·基本介绍第62-63页
   ·概要设计第63-67页
     ·功能需求第63页
     ·设计预期目标第63-64页
     ·运行环境第64页
     ·架构设计第64-66页
     ·整体流程图第66-67页
   ·关键子模块的设计与实现第67-71页
     ·基于取样的混合聚类器第67-69页
     ·基于分割的混合聚类器第69-71页
   ·数据结构及说明第71-78页
     ·聚类数据格式第71-74页
     ·聚类数据文件格式第74-75页
     ·聚类结果格式第75页
     ·聚类结果文件格式第75-76页
     ·函数MAP 结构第76页
     ·聚类器usage 结构第76-77页
     ·取样器结果数据格式第77-78页
     ·分割器结果数据格式第78页
   ·异常处理设计第78页
   ·配置项说明第78-83页
     ·日志相关配置第79页
     ·基于取样的混合聚类器配置第79-80页
     ·基于分割的混合聚类器配置第80页
     ·取样器配置第80-82页
     ·分割器配置第82-83页
   ·本章小结第83-84页
第五章 结论第84-86页
   ·全文总结第84-85页
   ·后续工作介绍第85-86页
致谢第86-87页
参考文献第87-91页
附录第91-93页
 1 聚类库资源第91-93页
   ·MATLAB 聚类库第91页
   ·东京大学开源聚类软件第91页
   ·CLUTO 聚类库第91-92页
   ·Weka 聚类包第92页
   ·聚类库总结第92-93页
在学期间研究成果第93-94页

论文共94页,点击 下载论文
上一篇:嵌入式富媒体引擎及场景标签语言的设计与实现
下一篇:数字化协作创作平台上的工作流流程编辑工具的设计与实现