首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的分布式数据挖掘关键技术研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-17页
    1.1 研究工作的背景与意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 K‐means聚类算法第11-12页
        1.2.2 BP神经网络算法第12-13页
        1.2.3 基于Hadoop的分布式数据挖掘项目第13-14页
    1.3 论文的主要研究内容第14-15页
    1.4 论文的结构安排第15-17页
第二章 基于Hadoop的分布式数据挖掘相关技术第17-28页
    2.1 Hadoop第17-22页
        2.1.1 MapReduce编程框架第17-19页
        2.1.2 HDFS文件系统第19-22页
            2.1.2.1 HDFS系统结构第20-21页
            2.1.2.2 HDFS健壮性第21-22页
    2.2 K‐means算法相关技术第22-25页
        2.2.1 算法流程第22-23页
        2.2.2 算法优缺点第23-25页
    2.3 机器学习相关算法第25-27页
    2.4 本章小结第27-28页
第三章 改进的K‐means++算法及其并行化实现第28-40页
    3.1 基于概率的初始化算法K‐means++第28-29页
    3.2 针对K‐means++算法的改进第29-34页
        3.2.1 存在的问题第29页
        3.2.2 引入属性权值第29-31页
        3.2.3 并行化改进第31-32页
        3.2.4 改进算法的伪码和流程第32-34页
        3.2.5 算法复杂度分析第34页
    3.3 改进算法的MapReduce实现第34-39页
    3.4 本章小结第39-40页
第四章 优化的BP神经网络及其并行化实现第40-54页
    4.1 BP神经网络第40-45页
        4.1.1 人工神经网络基础知识第40-43页
        4.1.2 BP神经网络原理和结构第43-44页
        4.1.3 BP神经网络的优缺点第44-45页
    4.2 结合改进的遗传算法优化网络结构和参数第45-49页
        4.2.1 遗传算法第45-46页
        4.2.2 改进的遗传算与BP神经网络结合第46-49页
    4.3 优化算法的并行化第49-53页
        4.3.1 并行化设计第49-51页
        4.3.2 MapReduce伪码第51-53页
    4.4 本章小结第53-54页
第五章 实验结果及分析第54-65页
    5.1 实验环境第54-56页
        5.1.1 软硬件环境第54页
        5.1.2 Hadoop部署第54-56页
    5.2 结果评价标准第56-57页
        5.2.1 加速比第56页
        5.2.2 扩展率第56-57页
    5.3 改进的K‐means++算法实验第57-60页
        5.3.1 数据集的选取第57页
        5.3.2 实验结果和分析第57-60页
    5.4 改进的BP神经网络算法实验第60-63页
        5.4.1 数据集的选取第60-61页
        5.4.2 实验结果及分析第61-63页
    5.5 本章小结第63-65页
第六章 结论与展望第65-67页
    6.1 全文总结第65-66页
    6.2 未来工作展望第66-67页
致谢第67-68页
参考文献第68-71页
读研期间的研究成果第71-72页

论文共72页,点击 下载论文
上一篇:公共交通开放数据平台及服务的设计与实现
下一篇:基于Delaunay的三维快速克里金插值