首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

云框架下的文本挖掘算法并行化研究

致谢第4-5页
摘要第5-6页
Abstract第6-7页
1 绪论第14-18页
    1.1 研究背景和意义第14-15页
    1.2 国内外研究现状第15-17页
    1.3 论文的主要工作第17页
    1.4 论文内容的组织第17-18页
2 大规模数据并行处理技术第18-26页
    2.1 云计算概述第18页
    2.2 云计算框架Hadoop第18-21页
    2.3 云计算框架Spark第21-24页
    2.4 Spark和Hadoop的比较第24-25页
    2.5 本章小结第25-26页
3 文本聚类与分类相关技术第26-36页
    3.1 文本预处理第26-29页
    3.2 文本表示第29-30页
    3.3 文本聚类第30-32页
    3.4 文本分类第32-35页
    3.5 本章小结第35-36页
4 基于Spark的大规模文本K-Means并行聚类算法第36-44页
    4.1 串行K-Means聚类算法第36-37页
    4.2 K-Means算法并行化可行性分析第37-38页
    4.3 基于Hadoop的K-Means聚类算法并行化第38-39页
    4.4 基于Spark的K-Means聚类算法并行化第39-42页
    4.5 两种并行化算法的比较第42-43页
    4.6 本章小结第43-44页
5 基于Spark的朴素贝叶斯文本分类并行化研究第44-56页
    5.1 朴素贝叶斯分类第44-48页
    5.2 朴素贝叶斯算法并行化可行性分析第48-49页
    5.3 基于Hadoop的朴素贝叶斯文本分类并行化第49-51页
    5.4 基于Spark的朴素贝叶斯文本分类并行化第51-55页
    5.5 两种并行化算法的比较第55页
    5.6 本章小结第55-56页
6 实验测试与分析第56-64页
    6.1 实验环境第56-58页
    6.2 实验文本数据第58-59页
    6.3 并行计算性能指标第59页
    6.4 K-Means文本聚类实验第59-62页
    6.5 朴素贝叶斯文本分类实验第62-63页
    6.6 本章小结第63-64页
7 总结与展望第64-66页
    7.1 结论第64页
    7.2 展望第64-66页
参考文献第66-70页
作者简历第70-72页
学位论文数据集第72页

论文共72页,点击 下载论文
上一篇:图像模糊复原及质量评价算法研究
下一篇:智能码垛机器人关键技术的研究及开发