首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向海量商品数据的分布式层次聚类算法设计与实现

摘要第4-5页
Abstract第5-6页
第1章 绪论第11-16页
    1.1 课题背景第11-13页
    1.2 研究内容第13-14页
    1.3 论文组织第14-15页
    1.4 本章小结第15-16页
第2章 相关工作第16-32页
    2.1 文本聚类简介第16-17页
    2.2 向量空间模型第17页
    2.3 TF-IDF算法第17-19页
    2.4 向量间距离的计算第19-20页
        2.4.1 距离计算的概念第19-20页
        2.4.2 距离计算方法的对比第20页
    2.5 常用聚类算法介绍第20-25页
        2.5.1 基于划分的聚类第20-22页
        2.5.2 层次聚类第22-24页
        2.5.3 基于密度的聚类第24-25页
    2.6 聚类算法对比以及分布式层次聚类算法第25-26页
    2.7 最小生成树算法第26-28页
    2.8 MapReduce框架介绍第28-30页
    2.9 本章小结第30-32页
第3章 需求分析和总体设计第32-36页
    3.1 需求分析第32-33页
    3.2 总体设计第33-35页
    3.3 本章小结第35-36页
第4章 商品数据建模第36-49页
    4.1 分词第36-38页
    4.2 商品数据去重第38-42页
    4.3 文本空间向量第42-46页
        4.3.1 商品数据的向量表示第42-43页
        4.3.2 通过TF-IDF计算单词权重第43-44页
        4.3.3 改进的TF-IDF算法在MapReduce框架下的实现第44-46页
    4.4 生成倒排索引第46-48页
    4.5 本章小结第48-49页
第5章 基于余弦相似度的文本聚类算法实现第49-61页
    5.1 最小生成树与单连接层次聚类第49-50页
    5.2 向量间距离的计算第50-52页
    5.3 最小生成树的分治算法第52-59页
        5.3.1 概述第52-53页
        5.3.2 最小生成树的合并第53-54页
        5.3.3 图的划分第54-56页
        5.3.4 最小生成树的分治算法在MapReduce框架下的实现第56-59页
    5.4 将聚类结果反向关联回报关单第59-60页
    5.5 本章小结第60-61页
第6章 实验结果及分析第61-74页
    6.1 实验环境第61页
    6.2 实验结果及分析第61-73页
        6.2.1 数据预处理模块结果及分析第61-65页
        6.2.2 TF-IDF计算性能及分析第65-67页
        6.2.3 距离计算性能及分析第67-68页
        6.2.4 分布式聚类算法结果及分析第68-73页
    6.3 本章小结第73-74页
第7章 总结和展望第74-76页
    7.1 总结第74页
    7.2 展望第74-76页
参考文献第76-79页
攻读硕士学位期间主要的研究成果第79-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:基于MPC5644的轻型车用柴油共轨系统轨压控制策略研究
下一篇:多通道营养液在线测控系统