摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第9-14页 |
1.1. 课题背景及意义 | 第9-10页 |
1.2. 国内外研究现状 | 第10-11页 |
1.2.1 商铺客流相关信息统计的研究与应用 | 第10页 |
1.2.2 page-rank算法在图模型中的应用 | 第10-11页 |
1.2.3 词向量生成算法的应用 | 第11页 |
1.3. 主要研究内容 | 第11-12页 |
1.4. 主要创新工作 | 第12-13页 |
1.5. 论文的框架结构 | 第13页 |
1.6. 本章小结 | 第13-14页 |
第二章 相关技术分析 | 第14-25页 |
2.1. Java服务器技术 | 第14-15页 |
2.1.1 无锁并发技术 | 第14-15页 |
2.1.2 资源池化思想 | 第15页 |
2.2. 常用数据挖掘算法 | 第15-24页 |
2.2.1 频繁集挖掘算法 | 第15-19页 |
2.2.2 page-rank算法 | 第19页 |
2.2.3 CBOW算法简介 | 第19-21页 |
2.2.4 相似样本查找算法 | 第21-24页 |
2.3. 本章小结 | 第24-25页 |
第三章 系统总体设计 | 第25-28页 |
3.1. 系统概述 | 第25页 |
3.2. 系统整体架构设计 | 第25-26页 |
3.3. 离线数据处理系统的任务流 | 第26-27页 |
3.4. 本章小结 | 第27-28页 |
第四章 系统关键技术以及实现 | 第28-58页 |
4.1. 无锁并发框架的设计与实现 | 第28-33页 |
4.2. 在线数据预处理系统设计与实现 | 第33-41页 |
4.2.1 数据库表结构 | 第33-34页 |
4.2.2 在线预处理系统的设计与实现 | 第34-39页 |
4.2.3 在线预处理流程 | 第39-41页 |
4.3. 离线数据处理系统设计与实现 | 第41-57页 |
4.3.1 商铺基本数据统计接口 | 第41-42页 |
4.3.2 分布式FP-growth算法框架 | 第42-45页 |
4.3.3 并行稀疏矩阵运算库 | 第45-50页 |
4.3.4 page-rank算法组件 | 第50-52页 |
4.3.5 改进的CBOW算法组件 | 第52-55页 |
4.3.6 随机投影森林算法组件 | 第55-57页 |
4.4. 本章小结 | 第57-58页 |
第五章 系统测试 | 第58-73页 |
5.1. 实验平台以及性能测试 | 第58-59页 |
5.2. 商铺基本统计数据 | 第59-61页 |
5.2.1 商铺每日每小时的客流数目 | 第59-60页 |
5.2.2 一个月内的商铺新老顾客数目比例 | 第60页 |
5.2.3 商铺的一个月内平均访问周期 | 第60-61页 |
5.2.4 商铺一个月内的顾客平均访问时间 | 第61页 |
5.3. 商铺评分结果测试 | 第61-65页 |
5.3.1 商铺基于客流比例的预评分结果 | 第61-62页 |
5.3.2 基于page-rank的商铺价值评估结果 | 第62-63页 |
5.3.3 基于page-rank的商铺评分模型结果分析 | 第63-65页 |
5.4. 商铺特征生成结果测试 | 第65-72页 |
5.4.1 改进的CBOW算法的商铺特征生成 | 第65-69页 |
5.4.2 CBOW算法在改进前后的性能对比 | 第69-71页 |
5.4.3 每个商铺的相似商铺召回结果 | 第71-72页 |
5.5. 本章总结 | 第72-73页 |
第六章 总结与展望 | 第73-74页 |
6.1. 总结 | 第73页 |
6.2. 未来工作 | 第73-74页 |
参考文献 | 第74-76页 |
致谢 | 第76-77页 |
攻读硕士学位期间已发表的论文 | 第77页 |