基于Hadoop的改进的并行Fp-Growth算法

目录	第4-6页
CONTENTS	第6-8页
中文摘要	第8-9页
ABSTRACT	第9-10页
第1章绪论	第11-16页
1.1 选题背景及意义	第11-12页
1.2 国内外研究现状	第12-14页
1.3 本文的主要工作	第14页
1.4 本文的组织结构	第14-16页
第2章 Hadoop相关知识	第16-24页
2.1 Hadoop简介	第16-17页
2.2 分布式文件管理系统HDFS	第17-19页
2.2.1 HDFS的体系结构	第17-18页
2.2.2 HDFS的读写流程	第18-19页
2.3 MapReduce编程模式	第19-22页
2.3.1 MapReduce的体系结构	第19-20页
2.3.2 MapReduce的工作流程	第20-22页
2.4 Hadoop的运行模式及系统支持	第22页
2.5 搭建Hadoop的开发和运行环境所需的软件	第22-24页
第3章改进的并行Fp-Growth算法的研究	第24-37页
3.1 Apriori算法	第24-25页
3.2 Fp-Growth算法	第25-26页
3.3 改进的并行Fp-Growth算法	第26-37页
3.3.1 数据分片	第28-29页
3.3.2 并行计数	第29-30页
3.3.3 均衡划分FList	第30-32页
3.3.4 并行Fp-Growth	第32-37页
第4章改进的并行Fp-Growth算法的应用	第37-45页
4.1 Web数据挖掘	第37页
4.2 数据来源	第37-42页
4.2.1 规范的服务器Web日志	第38-39页
4.2.2 自定义的Web日志	第39-42页
4.3 数据预处理	第42-45页
4.3.1 用户识别	第43页
4.3.2 会话识别	第43-44页
4.3.3 事务识别	第44-45页
第5章实验结果	第45-53页
5.1 实验环境	第45-47页
5.2 性能测试	第47-51页
5.2.1 变异系数	第47-50页
5.2.2 执行时间	第50-51页
5.3 结果分析	第51-53页
第6章结论和展望	第53-55页
6.1 结论	第53-54页
6.2 展望	第54-55页
附录	第55-61页
参考文献	第61-65页
致谢	第65-66页
学位论文评阅及答辩情况表	第66页