摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第一章 绪论 | 第11-16页 |
·课题背景 | 第11-12页 |
·国内外研究现状 | 第12-14页 |
·数据挖掘现状 | 第12-13页 |
·云平台现状 | 第13-14页 |
·研究目标及内容 | 第14-15页 |
·论文结构 | 第15-16页 |
第二章 相关技术介绍 | 第16-37页 |
·云计算概述 | 第16-18页 |
·云计算定义 | 第16页 |
·云计算特点 | 第16-17页 |
·关键技术 | 第17-18页 |
·现有云平台介绍 | 第18-23页 |
·Windows Azure Platform | 第18-19页 |
·Google 云平台 | 第19-20页 |
·Hadoop | 第20-23页 |
·聚类分析 | 第23-28页 |
·聚类分析的定义 | 第24页 |
·聚类分析中的距离度量 | 第24-26页 |
·常见聚类算法 | 第26-28页 |
·协同过滤 | 第28-30页 |
·基于内存的协同过滤算法 | 第28-29页 |
·基于模型的协同过滤算法 | 第29-30页 |
·Hadoop 平台搭建 | 第30-36页 |
·实验环境 | 第30-31页 |
·具体安装步骤 | 第31-35页 |
·小实例 | 第35-36页 |
·本章小结 | 第36-37页 |
第三章 聚类算法 K-Means 并行化 | 第37-49页 |
·K-Means 算法思想 | 第37-40页 |
·算法定义 | 第37-38页 |
·算法流程 | 第38-39页 |
·算法缺陷 | 第39-40页 |
·基于采样和密度的改进 K-Means 算法 | 第40-45页 |
·概念 | 第41页 |
·并行化改进 | 第41-45页 |
·复杂度分析 | 第45页 |
·实验 | 第45-48页 |
·聚类结果分析 | 第45-46页 |
·运行时间 | 第46-47页 |
·加速比 | 第47-48页 |
·本章小结 | 第48-49页 |
第四章 协同过滤改进与并行化 | 第49-71页 |
·基于用户协同过滤算法步骤 | 第49-52页 |
·用户信息表示 | 第50页 |
·相似度计算 | 第50-51页 |
·产生最近邻 | 第51-52页 |
·预测 | 第52页 |
·算法缺陷 | 第52-54页 |
·稀疏性问题 | 第52-53页 |
·冷启动问题 | 第53-54页 |
·扩展性问题 | 第54页 |
·基于属性权值预测推荐算法 | 第54-56页 |
·基于用户相似度与属性权值预测混合推荐算法 | 第56-57页 |
·并行化改进 | 第57-66页 |
·数据梳理 | 第59-61页 |
·最近邻计算 | 第61-62页 |
·评分预测 | 第62-64页 |
·属性权值预测 | 第64-66页 |
·实验 | 第66-70页 |
·实验数据 | 第66-67页 |
·实验评测标准 | 第67页 |
·实验结果 | 第67-70页 |
·本章小结 | 第70-71页 |
第五章 基于 Hadoop 平台数据挖掘系统的设计与实现 | 第71-87页 |
·系统简介 | 第71-73页 |
·实现目标 | 第71页 |
·开发环境 | 第71页 |
·总体架构 | 第71-73页 |
·服务引擎的实现 | 第73-81页 |
·服务引擎接口 | 第73-74页 |
·服务引擎使用 | 第74-81页 |
·挖掘引擎的实现 | 第81-84页 |
·数据管理服务 | 第81-82页 |
·算法服务 | 第82-83页 |
·资源管理服务 | 第83-84页 |
·日志服务 | 第84页 |
·系统测试 | 第84-86页 |
·本章小结 | 第86-87页 |
第六章 总结与展望 | 第87-89页 |
·总结 | 第87页 |
·展望 | 第87-89页 |
致谢 | 第89-90页 |
参考文献 | 第90-93页 |
攻硕期间取得的研究成果 | 第93-94页 |