| 摘要 | 第1-5页 |
| Abstract | 第5-11页 |
| 第一章 绪论 | 第11-21页 |
| ·引言 | 第11-13页 |
| ·研究现状 | 第13-16页 |
| ·海量数据挖掘算法面临的挑战 | 第16-19页 |
| ·海量的数据增长 | 第16-17页 |
| ·数据挖掘算法遇到的瓶颈 | 第17-18页 |
| ·大规模处理技术和面临存在的问题 | 第18-19页 |
| ·本文主要工作 | 第19-20页 |
| ·本文的组织结构 | 第20-21页 |
| 第二章 海量数据挖掘算法和并行化处理技术 | 第21-29页 |
| ·海量数据挖掘算法 | 第21页 |
| ·MapReduce模型 | 第21-23页 |
| ·Hadoop环境 | 第23-27页 |
| ·数据的存储 | 第24-26页 |
| ·任务的执行 | 第26-27页 |
| ·本章小结 | 第27-29页 |
| 第三章 非迭代类和迭代类数据挖掘算法并行化分析 | 第29-34页 |
| ·非迭代类算法并行化分析 | 第29-30页 |
| ·迭代类算法并行化分析 | 第30-31页 |
| ·加速比和效率 | 第31-32页 |
| ·小结 | 第32-34页 |
| 第四章 梯度下降类迭代类算法的并行化 | 第34-49页 |
| ·支持向量机相关工作 | 第34-35页 |
| ·动机 | 第35页 |
| ·梯度下降简介 | 第35-36页 |
| ·并行化随机梯度下降技术 | 第36-38页 |
| ·方法概览 | 第36-37页 |
| ·并行等价性分析 | 第37-38页 |
| ·Pegasos算法 | 第38-39页 |
| ·支持向量机及Pegasos方法 | 第38页 |
| ·随机梯度下降过程 | 第38-39页 |
| ·并行化的Pegasos算法 | 第39-41页 |
| ·数据并行 | 第39-40页 |
| ·随机预抽样 | 第40页 |
| ·方法概览和分析 | 第40-41页 |
| ·基于MapReduce的并行化P-Pegasos | 第41-43页 |
| ·实验 | 第43-48页 |
| ·正确性验证 | 第44页 |
| ·比其他并行化方法快 | 第44-45页 |
| ·并行加速收敛 | 第45页 |
| ·拓展性分析 | 第45-48页 |
| ·分析与小结 | 第48-49页 |
| 第五章 期望最大化类迭代算法的并行研究 | 第49-61页 |
| ·EM算法和Kmeans算法 | 第49-50页 |
| ·聚类评估 | 第50-52页 |
| ·并行化K均值算法 | 第52-54页 |
| ·一种基于MapReduce的并行实现 | 第52-53页 |
| ·并行分析 | 第53-54页 |
| ·实验分析 | 第54-59页 |
| ·实验1 | 第55-57页 |
| ·实验2 | 第57页 |
| ·实验3 | 第57-59页 |
| ·EM类算法并行小结 | 第59-61页 |
| 第六章 总结和展望 | 第61-62页 |
| 参考文献 | 第62-68页 |
| 简历与科研成果 | 第68-70页 |
| 致谢 | 第70-71页 |