首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce的文本聚类算法并行化研究与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-14页
    1.1 研究工作的背景与意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 本文主要工作第12-13页
    1.4 本文的组织结构第13-14页
第二章 MAPREDUCE编程模型研究第14-25页
    2.1 MapReduce基本介绍第14-16页
        2.1.1 MapReduce基本原理第14-15页
        2.1.2 MapReduce运行机制第15-16页
    2.2 MapReduce模型实现第16-24页
        2.2.1 Hadoop第16-22页
        2.2.2 Spark第22-24页
    2.3 本章小结第24-25页
第三章 文本聚类相关技术研究第25-42页
    3.1 文本预处理相关技术研究第25-32页
        3.1.1 中文文本分词第25-26页
        3.1.2 停用词过滤第26-27页
        3.1.3 特征选择第27-28页
        3.1.4 文本表示第28-31页
        3.1.5 文本相似度计算第31-32页
    3.2 聚类分析第32-38页
        3.2.1 基于划分的聚类第33-34页
        3.2.2 基于层次的聚类第34-35页
        3.2.3 基于密度的聚类第35-37页
        3.2.4 基于网格的聚类第37-38页
    3.3 word2vec简介第38-41页
    3.4 本章小结第41-42页
第四章 布谷鸟搜索算法及其改进研究第42-50页
    4.1 布谷鸟搜索算法的理论基础第42-45页
        4.1.1 莱维飞行第42-44页
        4.1.2 布谷鸟寄生行为第44页
        4.1.3 布谷鸟搜索算法模型第44-45页
        4.1.4 布谷鸟搜索算法特点第45页
    4.2 改进的布谷鸟搜索算法第45-46页
    4.3 仿真实验第46-49页
        4.3.1 测试函数及实验环境第46-48页
        4.3.2 实验结果分析第48-49页
    4.4 本章小结第49-50页
第五章 基于改进CS算法的吸引子传播算法研究第50-59页
    5.1 AP算法研究第50-53页
        5.1.1 AP算法原理第50-52页
        5.1.2 AP算法模型第52-53页
        5.1.3 AP算法的特点第53页
    5.2 AP算法改进第53-56页
    5.3 仿真实验第56-58页
        5.3.1 数据集及相关参数第56页
        5.3.2 聚类评测指标第56-57页
        5.3.3 实验结果分析第57-58页
    5.4 本章小结第58-59页
第六章 基于SPARK的文本聚类并行化研究第59-66页
    6.1 基于Spark的文本预处理研究第59-62页
        6.1.1 数据存储方案第59页
        6.1.2 中文分词方案第59-60页
        6.1.3 文本表示方案第60页
        6.1.4 Spark实现方案第60-62页
    6.2 基于Spark的CSAP算法研究第62-63页
        6.2.1 CSAP算法的简化操作第62页
        6.2.2 Spark实现方案第62-63页
    6.3 实验验证第63-65页
        6.3.1 实验环境及实验数据第63-64页
        6.3.2 评价指标第64页
        6.3.3 实验结果分析第64-65页
    6.4 本章小结第65-66页
第七章 总结与展望第66-68页
    7.1 全文总结第66页
    7.2 未来工作展望第66-68页
致谢第68-69页
参考文献第69-73页

论文共73页,点击 下载论文
上一篇:基于LVS的DRP分销系统设计与实现
下一篇:HMM在中文评价挖掘中的研究与应用