针对在线产品支撑数据的过滤和分析系统的研究与设计
| 摘要 | 第5-6页 |
| ABSTRACT | 第6页 |
| 第一章 绪论 | 第10-15页 |
| 1.1 研究工作的背景与意义 | 第10-11页 |
| 1.2 国内外研究历史与现状 | 第11-13页 |
| 1.2.1 数据清洗的国内外研究现状 | 第11-12页 |
| 1.2.2 推荐系统的国内外研究现状 | 第12-13页 |
| 1.3 本文的主要贡献与创新 | 第13页 |
| 1.4 本论文的结构安排 | 第13-15页 |
| 第二章 关键理论概述 | 第15-29页 |
| 2.1 数据清洗 | 第15-20页 |
| 2.1.1 数据质量 | 第16-18页 |
| 2.1.2 数据质量问题 | 第18-20页 |
| 2.1.3 清洗流程 | 第20页 |
| 2.2 推荐系统 | 第20-28页 |
| 2.2.1 推荐系统的概念 | 第20-21页 |
| 2.2.2 推荐系统分类 | 第21-24页 |
| 2.2.2.1 基于内容的推荐系统 | 第21-22页 |
| 2.2.2.2 协同过滤推荐系统 | 第22-24页 |
| 2.2.2.3 混合推荐系统 | 第24页 |
| 2.2.3 推荐系统的评价 | 第24-28页 |
| 2.2.3.1 用户满意度 | 第25页 |
| 2.2.3.2 预测准确度 | 第25-27页 |
| 2.2.3.3 实时性 | 第27-28页 |
| 2.3 本章小结 | 第28-29页 |
| 第三章 数据清洗 | 第29-40页 |
| 3.1 数据清洗的算法 | 第29-30页 |
| 3.2 相似重复记录清理 | 第30-36页 |
| 3.2.1 编辑距离算法 | 第30-32页 |
| 3.2.2 存在的不足 | 第32页 |
| 3.2.3 改进的编辑距离算法 | 第32-36页 |
| 3.2.3.1 算法步骤 | 第32-33页 |
| 3.2.3.2 实验及结果 | 第33-36页 |
| 3.3 在线数据清洗 | 第36-39页 |
| 3.3.1 数据介绍 | 第36-37页 |
| 3.3.2 数据质量分析 | 第37-38页 |
| 3.3.3 清洗规则设计 | 第38-39页 |
| 3.4 本章小结 | 第39-40页 |
| 第四章 在线文档推荐 | 第40-58页 |
| 4.1 实验数据介绍 | 第40页 |
| 4.2 算法及实验 | 第40-52页 |
| 4.2.1 顺序模式挖掘 | 第40-42页 |
| 4.2.2 关联规则挖掘 | 第42-46页 |
| 4.2.3 基于内容推荐 | 第46-48页 |
| 4.2.4 基于用户的协同过滤 | 第48-50页 |
| 4.2.5 基于物品的协同过滤 | 第50-52页 |
| 4.3 基于时间权重的协同过滤推荐 | 第52-57页 |
| 4.3.1 问题分析 | 第52-53页 |
| 4.3.2 算法流程 | 第53-54页 |
| 4.3.3 实验结果 | 第54-57页 |
| 4.4 本章小结 | 第57-58页 |
| 第五章 系统总体设计 | 第58-78页 |
| 5.1 总体框架需求与设计 | 第58-60页 |
| 5.2 数据清洗模块 | 第60-64页 |
| 5.2.1 相似重复记录清理 | 第61-62页 |
| 5.2.2 错误及缺失值处理 | 第62-64页 |
| 5.3 在线推荐模块 | 第64-74页 |
| 5.3.1 分布式协同过滤算法分析 | 第65-68页 |
| 5.3.2 分布式基于时间权重的协同过滤算法设计 | 第68-73页 |
| 5.3.3 单机与分布式推荐算法对比实验 | 第73-74页 |
| 5.4 前端可视化模块 | 第74-76页 |
| 5.4.1 推荐结果展示 | 第74-75页 |
| 5.4.2 统计结果展示 | 第75-76页 |
| 5.5 本章小结 | 第76-78页 |
| 第六章 全文总结与展望 | 第78-80页 |
| 6.1 全文总结 | 第78页 |
| 6.2 后续工作展望 | 第78-80页 |
| 致谢 | 第80-81页 |
| 参考文献 | 第81-85页 |
| 攻读硕士学位期间取得的成果 | 第85-86页 |