首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

连续序列模式并行挖掘研究

摘要第5-6页
Abstract第6页
第一章 绪论第9-14页
    1.1 研究背景及意义第9页
    1.2 国内外研究现状第9-12页
    1.3 课题研究内容和创新点第12页
        1.3.1 课题研究内容第12页
        1.3.2 课题创新点第12页
    1.4 本文组织结构第12-14页
第二章 相关知识与算法第14-32页
    2.1 序列模式第14-23页
        2.1.1 相关定义第14-15页
        2.1.2 典型的序列模式挖掘算法第15-21页
        2.1.3 现有的并行序列模式挖掘算法第21-23页
    2.2 HOOP及相关知识介绍第23-31页
        2.2.1 Hadoop概述第23-24页
        2.2.2 HDFS与Map/Reduce介绍第24-28页
        2.2.3 Hive简介第28-29页
        2.2.4 Hive执行原理与组件第29-31页
    2.3 本章小结第31-32页
第三章 CONTINUOUS-PREFIXSPAN串行连续序列模式挖掘算法第32-38页
    3.1 算法思路第32页
    3.2 算法改进介绍第32-34页
    3.3 算法复杂度分析第34页
    3.4 算法的应用实例及结果对比第34-36页
    3.5 效率对比第36-37页
    3.6 本章小结第37-38页
第四章 并行数据预处理方案第38-45页
    4.1 HIVE与传统关系数据库系统的对比第38-39页
    4.2 预处理设计与实现第39-42页
        4.2.1 导入原始数据第40页
        4.2.2 数据清洗第40-41页
        4.2.3 导出处理完的数据第41-42页
    4.3 HIVE查询优化第42-44页
    4.4 本章小结第44-45页
第五章 CONTINUOUS-PREFIXSPAN并行算法(CPMR)及在HADOOP平台上的实现第45-54页
    5.1 需求描述第45页
    5.2 并行改进基本思路第45-48页
    5.3 实例演示第48-53页
    5.4 算法复杂度分析第53页
    5.5 本章小结第53-54页
第六章 实验结果与分析第54-64页
    6.1 试验软硬件描述第54-55页
        6.1.1 集群节点及硬件环境第54-55页
        6.1.2 软件环境第55页
    6.2 HADOOP平台的搭建第55-59页
        6.2.1 SSH配置第56页
        6.2.2 master和slaves的配置第56-57页
        6.2.3 Hadoop环境变量配置第57页
        6.2.5 Hadoop的配置第57-59页
    6.3 HIVE框架部署第59-61页
    6.4 测试数据的来源、格式和规模第61页
    6.5 实验结果与对比分析第61-64页
总结和展望第64-66页
参考文献第66-69页
攻读硕士学位期间发表的论文及参与的项目第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于AWR的优化方法在税务一户式查询中的应用
下一篇:绩效考核指标体系的构建及在贵州省地税中的应用