首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量数据上基于抽样的模式挖掘研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-17页
    1.1 课题背景及研究的目的和意义第9-10页
    1.2 频繁模式挖掘研究现状第10-13页
        1.2.1 Apriori 算法及其扩展算法第10-11页
        1.2.2 FP-Growth 算法集扩展算法第11-12页
        1.2.3 垂直挖掘思想算法第12-13页
    1.3 抽样挖掘研究现状第13-15页
    1.4 本文主要研究内容第15-16页
    1.5 本文组织结构第16-17页
第2章 增强的两步随机抽样算法第17-32页
    2.1 引言第17页
    2.2 频繁模式挖掘相关定义第17-18页
    2.3 两步直接抽样算法第18-19页
    2.4 增强的两步随机抽样算法第19-22页
        2.4.1 算法的整体框架第19-21页
        2.4.2 算法描述与分析第21-22页
    2.5 实验结果与分析第22-30页
        2.5.1 实验设计及环境第22-23页
        2.5.2 实验数据第23-24页
        2.5.3 合成数据集实验第24-29页
        2.5.4 真实数据集实验第29-30页
    2.6 本章小结第30-32页
第3章 基于 MapReduce 的分布式抽样挖掘算法第32-50页
    3.1 引言第32页
    3.2 MapReduce 框架介绍第32-35页
    3.3 分布式挖掘抽样算法第35-43页
        3.3.1 问题分析第35-36页
        3.3.2 WRS 问题解决方案第36-39页
        3.3.3 Lossy Counting 算法第39-42页
        3.3.4 基于 MapReduce 的抽样挖掘算法第42-43页
    3.4 实验结果与分析第43-49页
        3.4.1 实验设计及环境第43-44页
        3.4.2 实验数据第44页
        3.4.3 性能实验第44-48页
        3.4.4 抽样命中率实验第48-49页
    3.5 本章小结第49-50页
结论第50-52页
参考文献第52-56页
攻读硕士学位期间发表的论文第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:数据一致性分析结果向可信度转换方法及工具研究
下一篇:基于医学图像的三维心脏建模研究