首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的大数据聚类挖掘算法的研究与应用

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第13-22页
    1.1 课题研究背景及意义第13-14页
    1.2 课题的国内外研究现状第14-20页
        1.2.1 聚类挖掘模型的研究现状第14-16页
        1.2.2 大数据聚类算法的研究现状第16-19页
        1.2.3 大数据聚类算法的发展趋势第19-20页
    1.3 论文的组织结构第20-22页
第2章 基于MapReduce的二阶CTK聚类改进算法第22-37页
    2.1 Canopy聚类挖掘算法第22-24页
    2.2 聚类的相似性度量及其数据表示第24-26页
        2.2.1 相似性度量的选取第25-26页
        2.2.2 聚类的数据结构表示第26页
    2.3 二阶CTK聚类改进算法第26-33页
        2.3.1 确定最佳簇数第27-29页
        2.3.2 动态改变区域半径第29-30页
        2.3.3 CTK一阶段改进Canopy算法第30页
        2.3.4 CTK二阶段算法的并行化设计第30-33页
    2.4 实验仿真及结果分析第33-35页
        2.4.1 实验数据及其预处理第33页
        2.4.2 实验结果分析第33-35页
    2.5 本章小结第35-37页
第3章 面向空间数据分配的聚类优化算法第37-54页
    3.1 空间数据分配问题第37页
    3.2 面向空间数据分配的聚类算法第37-48页
        3.2.1 中心点二次聚类第41-44页
        3.2.2 确定性判定第44-45页
        3.2.3 信息熵加权第45-46页
        3.2.4 Combine优化第46-47页
        3.2.5 算法流程第47-48页
    3.3 实验仿真与分析第48-52页
        3.3.1 实验数据及其预处理第48-49页
        3.3.2 实验结果分析第49-52页
    3.4 本章小结第52-54页
第4章 聚类算法在网站日志分析中的应用第54-67页
    4.1 网站日志分析的框架设计第54-57页
        4.1.1 日志数据采集与存储第54-55页
        4.1.2 日志数据清洗第55-56页
        4.1.3 噪声数据处理第56页
        4.1.4 用户识别第56页
        4.1.5 会话识别第56页
        4.1.6 会话及其相似度表示第56-57页
    4.2 系统搭建与实验第57-59页
        4.2.1 Hadoop集群的部署第57-59页
    4.3 基于日志数据的用户聚类的实现第59-64页
        4.3.1 用户相似度计算第61-63页
        4.3.2 聚类过程实现第63-64页
    4.4 实验结果分析第64-65页
    4.5 本章小结第65-67页
第5章 结论与展望第67-69页
    5.1 结论第67页
    5.2 展望第67-69页
参考 文献第69-75页
攻读学位期间参加的科研项目和成果第75-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:基于GPU的数据挖掘算法并行化研究
下一篇:三角网格曲面求交算法的研究与应用