首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量数据挖掘中的分类方法研究

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-18页
    1.1 研究背景与意义第11页
    1.2 国内外研究现状第11-14页
    1.3 论文的主要工作和结构安排第14-18页
第2章 基于Hadoop平台的分布式处理系统的构建第18-27页
    2.1 引言第18页
    2.2 Hadoop平台的基础构成第18-20页
    2.3 Hadoop框架核心第20-23页
        2.3.1 HDFS(Hadoop分布式文件系统)第20-22页
        2.3.2 MapReduce并行化编程模型第22-23页
    2.4 基于Hadoop的分布式处理系统的构建第23-26页
        2.4.1 基于Hadoop平台的分布式处理系统的构建过程第23-24页
        2.4.2 基于Hadoop平台的分布式处理系统的测试第24-26页
    2.5 本章小结第26-27页
第3章 基于贝叶斯原理的分类方法研究第27-33页
    3.1 引言第27页
    3.2 数据集预处理第27-29页
        3.2.1 数据离散化第27-29页
        3.2.2 拉普拉斯校准第29页
    3.3 朴素贝叶斯分类算法第29-31页
    3.4 基于贝叶斯算法的改进第31-32页
    3.5 本章小结第32-33页
第4章 改进的最近邻优先吸收特征粗聚类算法第33-44页
    4.1 引言第33页
    4.2 特征聚类算法改进第33-39页
        4.2.1 最近邻优先吸收聚类算法(NNAF)第33-34页
        4.2.2 基于canopy算法的改进最近邻优先聚类算法第34-38页
        4.2.3 改进聚类算法的MapReduce化第38-39页
    4.3 改进算法效果测试与对比第39-43页
        4.3.1 实验步骤第40页
        4.3.2 实验中的难点及解决方法第40页
        4.3.3 实验结果分析第40-43页
    4.4 本章小结第43-44页
第5章 基于特征筛选和特征加权的改进贝叶斯第44-56页
    5.1 引言第44页
    5.2 特征筛选第44-51页
        5.2.1 关联度计算第44-45页
        5.2.2 基于关联规则的类频繁项集挖掘方法第45-49页
        5.2.3 基于特征相关度判断的特征筛选第49-51页
    5.3 特征加权第51-52页
    5.4 改进效果测试第52-55页
        5.4.1 实验步骤第52-53页
        5.4.2 实验结果分析第53-55页
    5.5 本章小结第55-56页
第6章 改进朴素贝叶斯分类算法的并行化实现及结果分析第56-69页
    6.1 引言第56页
    6.2 面向海量数据的改进贝叶斯分类算法的实现步骤第56-57页
    6.3 计算环节并行化第57-62页
        6.3.1 连续特征离散化的并行处理第57-58页
        6.3.2 特征粗聚类的并行化第58页
        6.3.3 类频繁项集挖掘并行化第58-59页
        6.3.4 类频繁项集的特征筛选并行化第59-60页
        6.3.5 特征加权的MapReduce并行化第60-61页
        6.3.6 贝叶斯算法的MapReduce并行化第61页
        6.3.7 测试算法的并行化第61-62页
    6.4 实验结果及分析第62-68页
        6.4.1 实验平台和数据集介绍第62-63页
        6.4.2 实验内容第63-64页
        6.4.3 实验结果及分析第64-68页
    6.5 本章小结第68-69页
第7章 总结与展望第69-71页
    7.1 总结第69-70页
    7.2 展望第70-71页
致谢第71-72页
参考文献第72-77页
附录第77页

论文共77页,点击 下载论文
上一篇:两性霉素B脂质体临床前药物代谢动力学研究
下一篇:基于上下文的智能手机拍照行为感知及节能方案的研究