| 摘要 | 第5-6页 |
| ABSTRACT | 第6-7页 |
| 第一章 绪论 | 第10-16页 |
| 1.1 究背景与意义 | 第10-11页 |
| 1.2 国内外研究现状 | 第11-12页 |
| 1.3 主要研究内容 | 第12-13页 |
| 1.4 论文组织结构 | 第13-16页 |
| 第二章 相关技术分析 | 第16-22页 |
| 2.1 Spark分布式计算框架 | 第16-18页 |
| 2.1.1 Spark Core组件 | 第16页 |
| 2.1.2 Spark MLLIB组件 | 第16-18页 |
| 2.2 Storm实时流式处理框架 | 第18-20页 |
| 2.2.1 Storm基础组件与集群架构 | 第18-19页 |
| 2.2.2 Storm拓扑结构及其在实时场景下的优势 | 第19-20页 |
| 2.3 Kafka分布式消息处理系统 | 第20-21页 |
| 2.3.1 Kafka简介 | 第20页 |
| 2.3.2 实时场景下使用Kafka的优势 | 第20-21页 |
| 2.4 本章小结 | 第21-22页 |
| 第三章 排序算法模型的建立与选择 | 第22-40页 |
| 3.1 应用场景分析 | 第22页 |
| 3.2 数据预处理和特征选择 | 第22-28页 |
| 3.2.1 用户背景特征 | 第23-24页 |
| 3.2.2 详情页特征及候选项特征 | 第24-25页 |
| 3.2.3 统计类特征 | 第25-27页 |
| 3.2.4 特征离散化 | 第27-28页 |
| 3.3 样本抽样 | 第28-29页 |
| 3.4 排序模型选择 | 第29-38页 |
| 3.4.1 评价指标 | 第29-30页 |
| 3.4.2 逻辑回归模型 | 第30-34页 |
| 3.4.3 因子分解机模型 | 第34-37页 |
| 3.4.4 因子分解机模型与逻辑回归模型的比较 | 第37-38页 |
| 3.5 本章小结 | 第38-40页 |
| 第四章 基于排序模型的个性化推荐系统搭建 | 第40-60页 |
| 4.1 系统需求分析 | 第40页 |
| 4.2 系统总体框架设计 | 第40-42页 |
| 4.3 设计技术关键点分析 | 第42-43页 |
| 4.3.1 实时样本数据流的生成 | 第42-43页 |
| 4.3.2 样本特征及模型的存储 | 第43页 |
| 4.4 关键模块的设计与实现 | 第43-55页 |
| 4.4.1 重排序模块 | 第43-45页 |
| 4.4.2 特征存储模块 | 第45-47页 |
| 4.4.3 实时样本生成模块 | 第47-54页 |
| 4.4.4 模型存储模块 | 第54页 |
| 4.4.5 在线训练模块 | 第54-55页 |
| 4.5 系统结果 | 第55-58页 |
| 4.6 本章小结 | 第58-60页 |
| 第五章 总结与展望 | 第60-62页 |
| 5.1 研究工作总结 | 第60页 |
| 5.2 工作展望 | 第60-62页 |
| 参考文献 | 第62-66页 |
| 致谢 | 第66-68页 |
| 攻读学位期间发表的学术论文目录 | 第68页 |