首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的多数据源数据挖掘技术应用研究

摘要第3-4页
Abstract第4-5页
1 引言第9-13页
    1.1 课题的背景、来源及意义第9-10页
        1.1.1 课题背景第9页
        1.1.2 课题来源第9-10页
        1.1.3 课题研究意义第10页
    1.2 国内外研究现状第10-11页
        1.2.1 国外的研究现状第10页
        1.2.2 国内的研究现状第10-11页
    1.3 课题主要工作第11页
    1.4 论文组织结构第11-13页
2 相关理论与技术研究第13-21页
    2.1 软件服务相关技术第13-14页
        2.1.1 软件即服务概念第13页
        2.1.2 软件即服务特点第13页
        2.1.3 软件即服务应用第13-14页
    2.2 数据挖掘的相关技术第14-17页
        2.2.1 数据挖掘的定义第14页
        2.2.2 数据挖掘的基本流程第14-15页
        2.2.3 数据挖掘的功能第15页
        2.2.4 聚类挖掘第15-16页
        2.2.5 关联规则算法第16-17页
    2.3 基于Hadoop的数据挖掘第17-19页
        2.3.1 Hadoop平台的介绍第17-18页
        2.3.2 Sqoop数据导入导出工具第18页
        2.3.3 Hive数据仓库第18页
        2.3.4 Mahout并行数据挖掘算法第18-19页
        2.3.5 HBase数据库第19页
    2.4 基于Hadoop的数据挖掘技术的优势第19页
    2.5 小结第19-21页
3 基于Hadoop的多数据源挖掘平台框架第21-28页
    3.1 核心业务流程第21-23页
        3.1.1 多数据源整合第21-22页
        3.1.2 优质企业模型第22页
        3.1.3 优质商品种类模型第22-23页
        3.1.4 分析关联商品种类第23页
    3.2 基于Hadoop的数据挖掘平台整体方案第23-24页
    3.3 各阶段方案分析第24-27页
        3.3.1 数据处理库方案分析第24-25页
        3.3.2 算法库方案分析第25-26页
        3.3.3 规则库方案分析第26-27页
    3.4 小结第27-28页
4 基于Hadoop的多数据源挖掘平台设计与实现第28-40页
    4.1 数据处理库的设计与实现第28-32页
        4.1.1 数据加载第28-29页
        4.1.2 数据清洗第29页
        4.1.3 数据仓库搭建第29-32页
        4.1.4 数据处理库设计总结第32页
    4.2 算法库的设计与实现第32-37页
        4.2.1 聚类实现及其优化第32-35页
        4.2.2 关联实现及其优化第35-36页
        4.2.3 数据挖掘结果存储第36-37页
        4.2.4 算法库设计总结第37页
    4.3 规则库设计与实现第37-40页
        4.3.1 聚类规则设计与实现第37-38页
        4.3.2 关联规则设计与实现第38-39页
        4.3.3 规则库设计总结第39-40页
5 实验结果分析第40-51页
    5.1 实验环境设计第40-42页
        5.1.1 硬件环境第40页
        5.1.2 软件环境第40-41页
        5.1.3 实验数据第41-42页
    5.2 实验结果展示第42-46页
        5.2.1 聚类结果展示第42-45页
        5.2.2 关联结果展示第45-46页
    5.3 分析与对比第46-51页
        5.3.1 性能分析第46-48页
        5.3.2 数据挖掘结果分析第48-51页
6 总结与展望第51-53页
    6.1 全文总结第51-52页
    6.2 展望第52-53页
参考文献第53-55页
申请学位期间的研究成果及发表的学术论文第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:复杂约束下的串联机械臂运动学控制方法研究
下一篇:新型碳化硅功率二极管的研究