基于Storm与在线机器学习的广告点击率预测的研究
摘要 | 第3-4页 |
ABSTRACT | 第4页 |
第1章 绪论 | 第7-11页 |
1.1 研究背景 | 第7-8页 |
1.2 研究的意义 | 第8页 |
1.3 国内外现状研究 | 第8-9页 |
1.4 研究内容和解决的问题 | 第9页 |
1.5 论文主要特色工作 | 第9页 |
1.6 论文的结构 | 第9-11页 |
第2章 广告日志与流处理 | 第11-22页 |
2.1 网络广告 | 第11-16页 |
2.1.1 网络广告的营销模式 | 第12-13页 |
2.1.2 网络广告分类 | 第13-14页 |
2.1.3 网络广告推荐基本流程 | 第14-16页 |
2.2 流处理 | 第16-18页 |
2.3 基于流处理的在线机器学习 | 第18-19页 |
2.4 评价指标 | 第19-21页 |
2.4.1 LogarithmicLoss | 第19-20页 |
2.4.2 AUC | 第20页 |
2.4.3 逐步验证 | 第20-21页 |
2.5 本章小结 | 第21-22页 |
第3章 广告日志处理 | 第22-28页 |
3.1 广告日志流处理 | 第22-23页 |
3.2 用于机器学习的广告特征提取 | 第23-24页 |
3.3 特征预处理 | 第24-27页 |
3.3.1 特征哈希 | 第25-26页 |
3.3.2 特征过滤 | 第26-27页 |
3.3.3 实时特征 | 第27页 |
3.4 本章小结 | 第27-28页 |
第4章 广告点击率预估算法 | 第28-43页 |
4.1 机器学习算法 | 第28-31页 |
4.1.1 逻辑回归 | 第28-29页 |
4.1.2 因式分解机 | 第29-31页 |
4.2 求解与优化方法 | 第31-38页 |
4.2.1 随机梯度下降 | 第31-32页 |
4.2.2 FTRL-Proximal算法 | 第32-34页 |
4.2.3 自适应学习率 | 第34-36页 |
4.2.4 改进的因式分解机 | 第36-38页 |
4.3 实验与分析 | 第38-42页 |
4.3.1 实验数据 | 第38-39页 |
4.3.2 实验环境 | 第39页 |
4.3.3 逻辑回归与因式分解机比较 | 第39-40页 |
4.3.4 改进的FM与传统FM比较 | 第40-42页 |
4.4 本章小结 | 第42-43页 |
第5章 点击率预测算法的分布式实现 | 第43-50页 |
5.1 分布式随机梯度下降 | 第43-45页 |
5.1.1 同步SGD | 第43页 |
5.1.2 异步SGD | 第43-44页 |
5.1.3 参数服务器 | 第44-45页 |
5.2 基于流处理的实现 | 第45-48页 |
5.2.1 系统设计 | 第45-46页 |
5.2.2 系统开销分析与处理 | 第46-47页 |
5.2.3 Storm拓扑实现 | 第47-48页 |
5.3 实验与分析 | 第48-49页 |
5.4 本章小结 | 第49-50页 |
第6章 总结与展望 | 第50-52页 |
6.1 总结 | 第50页 |
6.2 展望 | 第50-52页 |
致谢 | 第52-53页 |
参考文献 | 第53-55页 |