致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
1 引言 | 第12-16页 |
1.1 论文背景 | 第12-13页 |
1.2 项目目标 | 第13-14页 |
1.3 关键问题和技术难度 | 第14-15页 |
1.4 论文主要工作和组织 | 第15页 |
1.5 小结 | 第15-16页 |
2 相关技术 | 第16-22页 |
2.1 HADOOP | 第16-17页 |
2.2 HDFS | 第17页 |
2.3 HIVE | 第17-18页 |
2.4 OOZIE | 第18-19页 |
2.5 PIG | 第19页 |
2.6 ELASTICSEARCH | 第19页 |
2.7 NODEJS | 第19-20页 |
2.8 小结 | 第20-22页 |
3 SEM广告数据分析系统需求分析 | 第22-34页 |
3.1 功能需求 | 第22-29页 |
3.1.1 后台管理 | 第22-24页 |
3.1.2 报表中心 | 第24-28页 |
3.1.3 物料中心 | 第28-29页 |
3.1.4 同步媒体 | 第29页 |
3.2 可行性分析 | 第29-30页 |
3.2.1 技术可行性 | 第30页 |
3.2.2 资源可行性 | 第30页 |
3.3 非功能性需求 | 第30-31页 |
3.3.1 运行环境需求 | 第31页 |
3.3.2 性能需求 | 第31页 |
3.3.3 系统结构需求 | 第31页 |
3.5 小结 | 第31-34页 |
4 SEM广告数据分析系统概要设计 | 第34-50页 |
4.1 架构设计 | 第34-35页 |
4.2 数据流程设计 | 第35-37页 |
4.3 系统功能模块设计如 | 第37-43页 |
4.3.1 数据拉取模块(fetcher) | 第38-39页 |
4.3.2 数据聚合模块(druid_data_generator) | 第39页 |
4.3.3 Hive导出druid模块(olap_data_loader) | 第39-40页 |
4.3.4 物料存储模块(save-es) | 第40-41页 |
4.3.5 物料查询模块(query-es) | 第41-42页 |
4.3.6 同步模块(uploader) | 第42页 |
4.3.7 ui数据访问接口(api-master) | 第42-43页 |
4.4 HIVE表设计 | 第43-48页 |
4.4.1 关键词表 | 第43-44页 |
4.4.2 返点表 | 第44-45页 |
4.4.3 账户结构表 | 第45页 |
4.4.4 推广组表 | 第45-46页 |
4.4.5 创意表 | 第46页 |
4.4.6 附加创意表 | 第46-47页 |
4.4.7 投放地域表 | 第47页 |
4.4.8 投放计划表 | 第47-48页 |
4.5 小结 | 第48-50页 |
5 系统功能详细设计与实现 | 第50-70页 |
5.1 数据拉取(FETCHER)功能详细设计与实现 | 第50-55页 |
5.1.1 数据拉取模块类图 | 第50-54页 |
5.1.2 数据拉取模块时序图 | 第54-55页 |
5.2 数据聚合功能详细设计与实现 | 第55-56页 |
5.2.1 聚合逻辑 | 第55-56页 |
5.3 HIVE上传DRUID模块功能详细设计与实现 | 第56-58页 |
5.3.1 Hive上传Druid脚本介绍 | 第57-58页 |
5.4 物料存储模块(SAVE-ES)功能详细设计与实现 | 第58-62页 |
5.4.1 物料存储模块类图 | 第58-59页 |
5.4.2 数据拉取模块类具体介绍 | 第59-61页 |
5.4.3 物料存储部分时序图 | 第61-62页 |
5.5 物料查询模块(QUERY-ES)功能详细设计与实现 | 第62-65页 |
5.5.1 物料查询模块类设计 | 第62-64页 |
5.5.2 时序图 | 第64-65页 |
5.6 UI接口(API-MASTER) | 第65-68页 |
5.6.1 UI接口类设计 | 第65-68页 |
5.7 小结 | 第68-70页 |
6 系统测试 | 第70-74页 |
6.1 测试概述 | 第70页 |
6.2 测试用例 | 第70-72页 |
6.3 验证性结果分析 | 第72页 |
6.4 小结 | 第72-74页 |
7 总结 | 第74-76页 |
7.1 结论 | 第74页 |
7.2 展望 | 第74-76页 |
参考文献 | 第76-78页 |
作者简历及攻读硕士/博士学位期间取得的研究成果 | 第78-80页 |
学位论文数据集 | 第80页 |