基于云计算的影视大数据处理关键问题研究与实现
| 摘要 | 第4-5页 |
| ABSTRACT | 第5页 |
| 第一章 绪论 | 第8-11页 |
| 1.1 研究背景 | 第8-9页 |
| 1.2 研究内容及意义 | 第9页 |
| 1.3 论文的组织结构 | 第9-10页 |
| 1.4 本章小结 | 第10-11页 |
| 第二章 相关技术介绍 | 第11-21页 |
| 2.1 大数据系统介绍 | 第11-12页 |
| 2.1.1 大数据概念 | 第11页 |
| 2.1.2 大数据处理与系统 | 第11-12页 |
| 2.2 云计算概念 | 第12-14页 |
| 2.2.1 云计算定义和特点 | 第12-13页 |
| 2.2.2 云计算关键技术 | 第13-14页 |
| 2.3 Hadoop介绍 | 第14-19页 |
| 2.3.1 MapReduce模型 | 第14-15页 |
| 2.3.2 HDFS文件系统 | 第15-19页 |
| 2.4 Xml解析 | 第19-20页 |
| 2.5 Oozie | 第20-21页 |
| 第三章 影视大数据处理需求分析 | 第21-32页 |
| 3.1 系统概述 | 第21-22页 |
| 3.2 系统软件架构 | 第22-23页 |
| 3.3 数据处理需求 | 第23-28页 |
| 3.3.1 数据来源分析 | 第23-24页 |
| 3.3.2 业务需求分析 | 第24-26页 |
| 3.3.3 数据处理要求 | 第26-28页 |
| 3.4 数据规模统计 | 第28-30页 |
| 3.5 非功能需求分析 | 第30-31页 |
| 3.6 本章小结 | 第31-32页 |
| 第四章 数据处理策略的设计 | 第32-45页 |
| 4.1 整体方案设计 | 第32-34页 |
| 4.2 基于关系型数据库的单机处理 | 第34-37页 |
| 4.2.1 演员相关数据处理 | 第34-35页 |
| 4.2.2 广告数据处理 | 第35-37页 |
| 4.3 基于Hadoop的数据处理 | 第37-44页 |
| 4.3.1 数据合并上传 | 第37-39页 |
| 4.3.2 编播分期处理 | 第39-40页 |
| 4.3.3 剧目网点处理 | 第40-41页 |
| 4.3.4 DB接口数据共享 | 第41-44页 |
| 4.3.5 Sqoop数据导入 | 第44页 |
| 4.4 本章小结 | 第44-45页 |
| 第五章 影视大数据处理的实现 | 第45-64页 |
| 5.1 广告文件处理实现 | 第45-49页 |
| 5.1.1 Excel文件解析 | 第45-48页 |
| 5.1.2 连接池使用 | 第48页 |
| 5.1.3 数据缓存处理 | 第48页 |
| 5.1.4 JVM内存调整 | 第48-49页 |
| 5.2 分钟收视率处理实现 | 第49-51页 |
| 5.3 编播分期处理实现 | 第51-56页 |
| 5.3.1 播放记录的去重 | 第51-52页 |
| 5.3.2 剧场表分片 | 第52-53页 |
| 5.3.3 剧目播放记录标记 | 第53-54页 |
| 5.3.4 生成轮次记录 | 第54-56页 |
| 5.4 剧目网点量处理实现 | 第56-61页 |
| 5.4.1 载入映射表 | 第58页 |
| 5.4.2 网点量原始数据合并 | 第58-59页 |
| 5.4.3 网点量汇总 | 第59-61页 |
| 5.5 数据导入实现 | 第61-63页 |
| 5.6 本章小结 | 第63-64页 |
| 第六章 总结与展望 | 第64-66页 |
| 参考文献 | 第66-68页 |
| 致谢 | 第68-69页 |
| 攻读学位期间发表的学术论文 | 第69页 |