Hadoop海量数据挖掘在宽带客户信息推送系统中的应用研究

摘要	第3-4页
ABSTRACT	第4-5页
第1章引言	第9-14页
1.1 研究背景及课题意义	第9-10页
1.2 课题来源	第10页
1.3 国内外研究现状	第10-11页
1.4 本文研究内容	第11-12页
1.5 论文组织结构	第12-14页
第2章需求分析与相关知识	第14-30页
2.1 需求分析	第14-18页
2.1.1 推送模式分析	第14页
2.1.2 推送数据分析	第14-18页
2.2 电信推送系统数据库服务器	第18-19页
2.3 数据挖掘相关知识	第19-23页
2.3.1 数据挖掘的定义	第19页
2.3.2 数据挖掘的过程	第19-21页
2.3.3 数据挖掘的方法	第21-22页
2.3.4 数据仓库	第22页
2.3.5 多维数据模型	第22-23页
2.4 关联规则理论	第23-29页
2.4.1 关联规则基本概念	第23-24页
2.4.2 经典 Apriori 算法	第24-29页
2.5 本章小结	第29-30页
第3章改进的 Apriori 算法	第30-40页
3.1 概况	第30-31页
3.2 基于多维项目压缩的 Apriori 改进算法	第31-39页
3.2.1 算法思想	第31-33页
3.2.2 算法伪代码	第33-35页
3.2.3 算法实例	第35-36页
3.2.4 测试与分析	第36-39页
3.3 本章小结	第39-40页
第4章基于 Hadoop 的 Apriori 改进算法并行化	第40-55页
4.1 Hadoop 分布式架构	第40-42页
4.1.1 Hadoop 概述	第40-41页
4.1.2 Hadoop 特性	第41-42页
4.2 MapReduce 分布式计算模型	第42-46页
4.2.1 MapReduce 概述	第42-44页
4.2.2 MapReduce 工作流程	第44-45页
4.2.3 MapReduce 中的关键技术	第45-46页
4.3 HDFS 分布式文件系统	第46-47页
4.3.1 HDFS 系统架构概述	第46-47页
4.3.2 HDFS 的关键技术	第47页
4.4 并行 Apriori 改进算法（MR_AprioriDpc）设计	第47-53页
4.4.1 实现思路	第47-50页
4.4.2 算法伪代码	第50-52页
4.4.3 测试与分析	第52-53页
4.5 本章小结	第53-55页
第5章 MR_AprioriDpc 算法的应用与实现	第55-70页
5.1 功能需求	第55-56页
5.2 系统架构	第56-59页
5.2.1 系统体系结构	第56-57页
5.2.2 系统功能模块	第57-58页
5.2.3 系统主界面	第58-59页
5.3 定制推送模块设计与实现	第59-69页
5.3.1 关联规则挖掘模型	第59-60页
5.3.2 数据仓库构建	第60-62页
5.3.3 关联规则挖掘功能设计与实现	第62-64页
5.3.4 推送任务定制功能设计与实现	第64-68页
5.3.5 定制推送统计功能设计与实现	第68-69页
5.4 本章小结	第69-70页
第6章总结与展望	第70-71页
6.1 总结	第70页
6.2 展望	第70-71页
致谢	第71-72页
参考文献	第72-73页