基于Hadoop的在线娱乐平台数据挖掘与分析的研究与实现

摘要	第5-7页
ABSTRACT	第7-8页
缩略语对照表	第11-14页
第一章绪论	第14-20页
1.1 研究背景与意义	第14-16页
1.2 国内外研究现状	第16-17页
1.3 本文的主要研究内容	第17-18页
1.4 论文组织结构	第18-20页
第二章相关知识与技术介绍	第20-34页
2.1 Hadoop体系介绍	第20-26页
2.1.1 HDFS介绍	第20-22页
2.1.2 Map Reduce编程模型	第22-24页
2.1.3 Hadoop的其他子项目介绍	第24-26页
2.2 网络爬虫技术	第26-29页
2.2.1 网络爬虫流程介绍	第26-27页
2.2.2 网站结构分析	第27-28页
2.2.3 常见的爬虫策略介绍	第28-29页
2.3 数据挖掘介绍	第29-32页
2.3.1 数据挖掘的定义	第29-30页
2.3.2 数据挖掘流程	第30-31页
2.3.3 数据挖掘的常用方法	第31-32页
2.4 本章小结	第32-34页
第三章在线娱乐平台数据获取的设计	第34-44页
3.1 在线娱乐平台介绍	第34-36页
3.2 爬虫获取网络数据	第36-41页
3.2.1 Node.js爬虫使用的技术模块	第36-37页
3.2.2 爬虫架构的设计	第37-39页
3.2.3 爬虫数据的成果展示	第39-41页
3.3 对爬虫数据的预处理	第41-42页
3.4 本章小结	第42-44页
第四章 Apriori关联挖掘算法的改进	第44-52页
4.1 关联规则挖掘基本概念	第44页
4.2 Apriori算法的介绍	第44-46页
4.2.1 Apriori算法的基本流程	第44-45页
4.2.2 Apriori算法实现原理	第45-46页
4.3 Apriori算法的改进	第46-48页
4.3.1 临时表的介绍	第47页
4.3.2 算法改进的思路	第47-48页
4.4 实验与分析	第48-50页
4.4.1 新旧算法性能的对比分析	第48-49页
4.4.2 实验结论验证	第49-50页
4.5 本章小结	第50-52页
第五章在线娱乐平台数据挖掘系统的设计	第52-64页
5.1 Hadoop平台的搭建	第52-58页
5.1.2 搭建Hadoop平台的步骤	第53-57页
5.1.3 启动Hadoop进行验证	第57-58页
5.2 在线娱乐平台主播数据迁移的实现	第58-61页
5.2.1 数据仓库简介	第58-59页
5.2.2 实现数据迁移的工具--sqoop	第59-60页
5.2.3 数据迁移的实现	第60-61页
5.3 在线娱乐平台主播数据挖掘的实现	第61-63页
5.3.1 对主播类型与观众互动度的关联挖掘分析	第61-62页
5.3.2 对主播类型与主播粉丝数的关联挖掘分析	第62-63页
5.4 本章小结	第63-64页
第六章总结与展望	第64-66页
6.1 论文总结	第64-65页
6.2 展望	第65-66页
参考文献	第66-70页
致谢	第70-72页
作者简介	第72-73页