首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的海量图书流通数据的kmeans分析

摘要第3-4页
Abstract第4页
第一章 绪论第8-12页
    1.1 课题研究背景及意义第8-9页
    1.2 国内外研究现状第9-10页
        1.2.1 云计算平台现状第9-10页
        1.2.2 聚类算法现状第10页
    1.3 论文研究内容第10-11页
    1.4 论文组织结构第11-12页
第二章 云计算技术第12-26页
    2.1 云计算第12-13页
        2.1.1 云计算产生背景及定义第12页
        2.1.2 云计算特点第12-13页
    2.2 Hadoop技术第13-16页
        2.2.1 Hadoop背景第13-14页
        2.2.2 Hadoop子项目第14-15页
        2.2.3 Hadoop工作架构第15页
        2.2.4 Hadoop优缺点第15-16页
    2.3 分布式文件系统(HDFS)第16-18页
        2.3.1 HDFS相关概念第16-17页
        2.3.2 HDFS文件的读写第17-18页
        2.3.3 HDFS局限性第18页
    2.4 MapReduce第18-21页
        2.4.1 MapReduce的工作流程第18-19页
        2.4.2 Mapreduce工作原理第19-21页
        2.4.3 Mapreduce容错机制第21页
    2.5 Hadoop平台的搭建第21-24页
        2.5.1 硬件环境第21页
        2.5.2 软件环境第21页
        2.5.3 Hadoop集群的搭建第21-23页
        2.5.4 Hadoop运行实例第23-24页
    2.6 本章小结第24-26页
第三章 数据挖掘技术第26-34页
    3.1 数据挖掘概念、过程及任务第26-28页
        3.1.1 数据挖掘概念第26页
        3.1.2 数据挖掘过程第26-27页
        3.1.3 数据挖掘的任务第27-28页
    3.2 数据挖掘发展趋势第28-29页
    3.3 数据挖掘算法研究工具R语言第29-30页
        3.3.1 R的概念和基本原理第29页
        3.3.2 R的特色第29-30页
        3.3.3 R语言用于数据挖掘第30页
    3.4 R与Hadoop的集成平台Rhadoop第30-33页
        3.4.1 Rhadoop简介第30-31页
        3.4.2 Rhadoop的安装第31-32页
        3.4.3 Rhadoop运行实例第32-33页
    3.5 本章小结第33-34页
第四章 Hadoop平台下Kmeans聚类算法的实现第34-52页
    4.1 Kmeans聚类算法简介第34-39页
        4.1.1 Kmeans定义第34-36页
        4.1.2 数据模型第36-37页
        4.1.3 kmeans聚类算法的R实现第37-38页
        4.1.4 Kmeans的缺陷第38-39页
    4.2 基于抽样和最大最小距离算法的Kmeans算法改进第39-45页
        4.2.1 最大最小距离算法第39-40页
        4.2.2 数据抽样第40-41页
        4.2.3 孤立点概述第41-43页
        4.2.4 网格化孤立点检测第43-45页
    4.3 Kmeans聚类算法并行化设计与实现第45-47页
    4.4 改进算法的性能评估研究第47-51页
        4.4.1 迭代次数和时间第47-48页
        4.4.2 加速比第48-49页
        4.4.3 算法复杂度分析第49-51页
    4.5 本章小结第51-52页
第五章 改进后的kmeans聚类算法在图书流通数据中的应用第52-60页
    5.1 数据准备第52-54页
        5.1.1 图书借阅表第52-53页
        5.1.2 学生借阅记录第53页
        5.1.3 图书库第53-54页
    5.2 数据预处理第54页
    5.3 数据挖掘的聚类过程第54-58页
        5.3.1 基于次数时间的聚类第55-56页
        5.3.2 基于读者的聚类第56-58页
    5.4 结果评估分析第58-59页
    5.5 本章小结第59-60页
第六章 总结和展望第60-62页
    6.1 总结第60-61页
    6.2 展望第61-62页
致谢第62-64页
参考文献第64-66页

论文共66页,点击 下载论文
上一篇:一种人工鱼群算法的改进及其对BP神经网络的优化研究
下一篇:基于人工复眼的动目标检测研究