摘要 | 第4-5页 |
Abstract | 第5页 |
目录 | 第7-9页 |
第1章 绪论 | 第9-17页 |
1.1 课题的来源和背景 | 第9-10页 |
1.2 与课题相关的国内外研究综述 | 第10-15页 |
1.2.1 Hadoop 处理海量数据的优势分析 | 第10-12页 |
1.2.2 国外研究应用现状 | 第12-13页 |
1.2.3 国内研究应用现状 | 第13-15页 |
1.3 本论文主要工作内容 | 第15-17页 |
第2章 海量广告日志分析系统需求分析与关键技术 | 第17-29页 |
2.1 百度凤巢系统业务介绍 | 第17-18页 |
2.2 海量广告日志分析系统的需求分析 | 第18-22页 |
2.2.1 使用系统的相关人员 | 第18-19页 |
2.2.2 海量广告日志分析系统需求用例 | 第19-21页 |
2.2.3 海量广告日志分析系统需求描述 | 第21-22页 |
2.3 系统采用的关键技术 | 第22-28页 |
2.3.1 Hadoop 介绍 | 第22-25页 |
2.3.2 Hadoop Streaming 技术介绍 | 第25-26页 |
2.3.3 CakePHP 开发框架介绍 | 第26-28页 |
2.4 本章小结 | 第28-29页 |
第3章 海量广告日志分析系统的设计 | 第29-42页 |
3.1 系统的总体架构设计 | 第29-30页 |
3.2 系统的功能结构设计 | 第30-36页 |
3.2.1 日志解析子模块的功能设计 | 第31-32页 |
3.2.2 日志分析挖掘子模块的功能设计 | 第32-33页 |
3.2.3 Web 展现子模块的功能设计 | 第33-36页 |
3.3 系统的总体数据流程设计 | 第36-37页 |
3.4 海量广告日志分析系统的数据表设计 | 第37-41页 |
3.4.1 黑名单线上展现明细表设计 | 第37-38页 |
3.4.2 注册商标侵权展现明细表设计 | 第38页 |
3.4.3 账户优化建议不合理明细表设计 | 第38-39页 |
3.4.4 创意无关操作导致质量度波动明细表设计 | 第39-40页 |
3.4.5 一星推左明细表设计 | 第40-41页 |
3.4.6 三星无推左明细表设计 | 第41页 |
3.5 本章小结 | 第41-42页 |
第4章 海量广告日志分析系统的实现 | 第42-73页 |
4.1 日志解析模块的实现 | 第42-45页 |
4.1.1 ASP 日志解析模块 | 第42-43页 |
4.1.2 DAS 日志解析模块 | 第43-44页 |
4.1.3 ShowQ 日志解析模块 | 第44-45页 |
4.2 日志分析挖掘模块的实现 | 第45-63页 |
4.2.1 广告质量度相关专题模块 | 第45-52页 |
4.2.2 广告审核相关专题模块 | 第52-57页 |
4.2.3 广告优化建议相关专题模块 | 第57-63页 |
4.3 Web 展示模块的实现 | 第63-72页 |
4.3.1 Web 展现模块在 CakePHP 框架下的实现 | 第63-66页 |
4.3.2 Web 展现模块的界面实现 | 第66-72页 |
4.4 本章小结 | 第72-73页 |
第5章 海量广告日志分析系统的测试 | 第73-78页 |
5.1 系统测试分析 | 第73页 |
5.2 模块单元测试 | 第73-74页 |
5.3 系统功能测试 | 第74-75页 |
5.4 非功能性测试 | 第75-77页 |
5.5 本章小结 | 第77-78页 |
结论 | 第78-79页 |
参考文献 | 第79-84页 |
致谢 | 第84-85页 |
个人简历 | 第85页 |