摘要 | 第1-4页 |
Abstract | 第4-6页 |
目录 | 第6-8页 |
第一章 绪论 | 第8-17页 |
§1.1 课题研究的目的和意义 | 第8-10页 |
§1.2 研究现状 | 第10-15页 |
§1.2.1 并行编程模式研究现状 | 第10-11页 |
§1.2.2 云计算及MapReduce研究现状 | 第11-13页 |
§1.2.3 数据挖掘并行算法研究现状 | 第13-15页 |
§1.3 本文研究内容与布局 | 第15-17页 |
第二章 理论基础研究与创新 | 第17-35页 |
§2.1 MapReduce并行编程模型 | 第17-19页 |
§2.1.1 MapReduce的来源 | 第17页 |
§2.1.2 MapReduce编程模型的基本思想 | 第17-19页 |
§2.2 Hadoop云计算平台 | 第19-27页 |
§2.2.1 Hadoop简介 | 第19-20页 |
§2.2.2 Hadoop分布式文件系统 | 第20-27页 |
§2.3 基于MapReduce的Hadoop加速比模型研究 | 第27-34页 |
§2.3.1 加速比和三种经典加速比模型 | 第27-31页 |
§2.3.2 基于MapReduce的Hadoop并行加速比模型研究 | 第31-34页 |
§2.4 本章小结 | 第34-35页 |
第三章 基于MapReduce的并行PLS算法研究与应用 | 第35-67页 |
§3.1 基于MapReduce的并行数据挖掘算法思想 | 第35-39页 |
§3.2 基于MapReduce的并行PLS的需求 | 第39页 |
§3.3 偏最小二乘算法(PLS) | 第39-41页 |
§3.3.1 PLS的基本思想 | 第40-41页 |
§3.3.2 PLS算法具体步骤 | 第41页 |
§3.4 并行偏最小二乘(PPLS) | 第41-53页 |
§3.4.1 并行数据预处理研究 | 第42-46页 |
§3.4.2 并行PLS主成分提取过程研究 | 第46-53页 |
§3.5 实验与分析 | 第53-66页 |
§3.5.1 实验目的 | 第53-54页 |
§3.5.2 实验环境 | 第54-55页 |
§3.5.3 Hadoop集群环境的配置 | 第55-59页 |
§3.5.4 实验数据 | 第59页 |
§3.5.5 实验环境参数设置与调优 | 第59-62页 |
§3.5.6 并行PLS回归实验与结果分析 | 第62-66页 |
§3.6 本章小结 | 第66-67页 |
第四章 基于MapReduce的商品共被引相似度研究与应用 | 第67-81页 |
§4.1 引言 | 第67-68页 |
§4.2 相似性度量研究 | 第68-70页 |
§4.3 共被引理论与优化 | 第70-72页 |
§4.3.1 引用矩阵和共被引矩阵 | 第70-71页 |
§4.3.2 提出引用矩阵和共被引矩阵 | 第71-72页 |
§4.4 改进后的标准相似度 | 第72-74页 |
§4.5 基于MapReduce的并行共被引分析方法 | 第74-77页 |
§4.6 实验与分析 | 第77-80页 |
§4.6.1 实验数据 | 第77页 |
§4.6.2 实验与结果分析 | 第77-79页 |
§4.6.3 并行PLS和并行共被引矩阵加速比对比 | 第79-80页 |
§4.7 本章小结 | 第80-81页 |
第五章 总结和展望 | 第81-83页 |
§5.1 论文的主要工作和成果 | 第81-82页 |
§5.2 后期工作及展望 | 第82-83页 |
参考文献 | 第83-89页 |
致谢 | 第89-90页 |
作者在攻读研究生期间主要研究成果 | 第90页 |