首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于分布式聚类分析的上网时长估算方法研究

摘要第4-5页
abstract第5页
第1章 绪论第8-12页
    1.1 选题背景和研究意义第8页
    1.2 国内外研究现状第8-9页
    1.3 研究内容第9-10页
    1.4 本文章节安排第10-12页
第2章 基本原理及分布式计算框架第12-29页
    2.1 基于密度的聚类第12-16页
        2.1.1 聚类概念第12页
        2.1.2 聚类过程第12-13页
        2.1.3 DBSCAN聚类算法第13-16页
    2.2 分布式计算框架第16-28页
        2.2.1 Hadoop第16-22页
        2.2.2 Spark第22-27页
        2.2.3 Spark与Hadoop的比较第27-28页
    2.3 本章小结第28-29页
第3章 分布式时长计算模型第29-39页
    3.1 模型总体设计第29-30页
    3.2 并行DBSCAN聚类第30-35页
        3.2.1 数据划分第30-31页
        3.2.2 本地局部聚类第31-34页
        3.2.3 全局聚类第34-35页
    3.3 时长计算第35-38页
    3.4 本章小结第38-39页
第4章 实验验证第39-56页
    4.1 实验环境第39-42页
        4.1.1 软硬件环境第39-40页
        4.1.2 集群环境配置第40-42页
    4.2 数据准备第42-47页
    4.3 参数优化及噪声数据的处理第47-49页
    4.4 分布式与单机效率对比第49-50页
    4.5 结果分析第50-54页
    4.6 本章小结第54-56页
结论第56-58页
参考文献第58-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:受限领域C语言问答系统的设计与实现
下一篇:基于兴趣模型的人群分流建模与仿真方法研究