首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Web日志的分布式并行数据挖掘算法研究

摘要第5-6页
abstract第6页
第一章 绪论第10-14页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 课题研究内容第13页
    1.4 论文组织结构第13-14页
第二章 Hadoop相关知识研究第14-21页
    2.1 MapReduce分布式模型第14-16页
    2.2 HDFS分布式文件系统第16-19页
        2.2.1 HDFS相关概念第17页
        2.2.2 HDFS的体系结构第17-18页
        2.2.3 HDFS的读写数据流第18-19页
    2.3 Mahout开源软件第19-20页
    2.4 本章小结第20-21页
第三章 数据挖掘与Web日志挖掘基础的研究第21-31页
    3.1 数据挖掘概述第21-22页
    3.2 数据挖掘的分析方法研究第22-25页
        3.2.1 人工神经网络第22-23页
        3.2.2 聚类分析第23页
        3.2.3 决策树第23-24页
        3.2.4 遗传算法第24页
        3.2.5 模糊集第24-25页
    3.3 聚类算法研究第25-28页
        3.3.1 聚类概念第25页
        3.3.2 聚类的数学模型第25-26页
        3.3.3 聚类算法的分类第26-28页
    3.4 Web数据挖掘研究第28-30页
        3.4.1 Web数据挖掘的特点和难点第28-29页
        3.4.2 Web数据挖掘的分类第29-30页
    3.5 本章小结第30-31页
第四章 Web日志聚类算法的改进研究第31-38页
    4.1 Web日志聚类相关算法研究第31-35页
        4.1.1 K-means算法研究第31-34页
        4.1.2 Canopy算法研究第34-35页
    4.2 基于Canopy的K-means算法改进设计第35-37页
        4.2.1 K-means算法不足的分析第35页
        4.2.2 Canopy算法不足的分析第35-36页
        4.2.3 基于Canopy的具体算法改进方案第36-37页
        4.2.4 改进算法分析第37页
    4.3 本章小结第37-38页
第五章 基于Web日志的分布式并行算法研究第38-45页
    5.1 基于K-means算法的并行化设计与分析第38-41页
        5.1.1 K-means并行化可行性分析第38-39页
        5.1.2 K-means并行化具体设计第39-40页
        5.1.3 算法时间复杂度分析第40-41页
        5.1.4 K-means并行化算法的总结第41页
    5.2 基于Canopy的K-means算法并行化设计第41-44页
        5.2.1 Canopy算法的并行化可行性分析第41-42页
        5.2.2 基于Canopy算法的具体改进方案第42-44页
        5.2.3 算法并行化分析第44页
    5.3 本章小结第44-45页
第六章 基于Hadoop的Web日志挖掘系统设计与实现第45-55页
    6.1 Web日志挖掘系统整体设计第45-46页
        6.1.1 Web日志挖掘概述第45页
        6.1.2 Web日志挖掘步骤第45-46页
        6.1.3 Web日志挖掘系统模块设计第46页
    6.2 Web日志挖掘的数据源第46-48页
        6.2.1 Web日志数据源类型第46-47页
        6.2.2 Web日志的构成和格式第47-48页
    6.3 日志预处理模块设计第48-51页
        6.3.1 主要流程设计第48-50页
        6.3.2 基于MapReduce的预处理逻辑设计第50-51页
    6.4 日志挖掘模块设计第51-54页
        6.4.1 Web日志数据模块结构第51-52页
        6.4.2 挖掘模块具体实现第52-54页
    6.5 本章小结第54-55页
第七章 实验设计与结果分析第55-68页
    7.1 Hadoop平台搭建第55-58页
    7.2 实验的数据集第58页
    7.3 预处理模块结果第58-59页
    7.4 对比串行算法和改进算法第59-60页
        7.4.1 实验结果及分析第60页
    7.5 对比串行化算法和并行化算法第60-62页
        7.5.1 实验结果及分析第61-62页
    7.6 对比普通并行化算法和改进并行化算法第62-66页
        7.6.1 实验结果及分析第65-66页
    7.7 聚类结果在实际应用中的分析第66-67页
    7.8 本章小结第67-68页
第八章 全文总结和未来展望第68-70页
    8.1 全文总结第68页
    8.2 未来展望第68-70页
致谢第70-71页
参考文献第71-75页

论文共75页,点击 下载论文
上一篇:高超声速飞行器气动弹性建模与鲁棒变增益控制
下一篇:虚拟社区传播对网络购买的影响研究