基于Hadoop的SVM算法优化及在文本分类中的应用

摘要	第4-6页
ABSTRACT	第6-7页
符号说明	第8-10页
目录	第10-12页
第一章绪论	第12-17页
1.1 本课题背景及意义	第12-13页
1.2 国内外研究现状	第13-15页
1.3 本文研究内容	第15-16页
1.4 本文组织结构	第16-17页
第二章相关理论及技术原理	第17-36页
2.1 Hadoop	第17-24页
2.1.1 HDFS	第18-21页
2.1.2 MapReduce	第21-24页
2.2 Spark	第24-28页
2.2.1 RDD	第25-27页
2.2.2 Spark资源管理与作业调度	第27页
2.2.3 Spark编程接口	第27-28页
2.3 支持向量机	第28-32页
2.3.1 线性支持向量机	第28-31页
2.3.2 非线性支持向量机	第31-32页
2.4 并行支持向量机发展	第32-34页
2.4.1 并行算法求二次规划	第32-33页
2.4.2 混合支持向量机	第33-34页
2.4.3 层叠支持向量机	第34页
2.5 文本分类	第34-35页
2.6 本章小结	第35-36页
第三章基于Hadoop的并行支持向量机	第36-47页
3.1 并行层叠支持向量机	第36-37页
3.2 分布式优化	第37-38页
3.3 并行层叠支持向量机实现过程	第38-42页
3.3.1 MapReduce实现过程	第39-40页
3.3.2 SMO实现过程	第40-42页
3.4 收敛性	第42-43页
3.5 实验	第43-45页
3.5.1 实验环境	第43页
3.5.2 实验数据	第43页
3.5.3 实验验证	第43-45页
3.6 本章小结	第45-47页
第四章基于Spark的并行梯度下降的支持向量机	第47-57页
4.1 随机梯度下降	第47-48页
4.2 微型批量并行梯度下降算法	第48-49页
4.3 核化	第49页
4.4 基于预设的微型批量并行梯度下降算法	第49-50页
4.5 去除预设维护方法	第50-51页
4.6 实验	第51-56页
4.6.1 实验环境	第51页
4.6.2 实验数据和参数	第51-52页
4.6.3 实验验证	第52-56页
4.7 本章小结	第56-57页
第五章并行支持向量机集成和应用	第57-70页
5.1 大云并行数据挖掘系统简介	第57-59页
5.2 系统集成	第59-64页
5.2.1 需求分析	第59-60页
5.2.2 概要设计	第60-61页
5.2.3 详细设计	第61-64页
5.4 在文本分类中的应用	第64-69页
5.4.1 文本处理	第64-65页
5.4.2 文本分类	第65-69页
5.5 本章小结	第69-70页
第六章总结和展望	第70-71页
参考文献	第71-74页
附录	第74-75页
致谢	第75-76页
攻读学位期间发表的学术论文目录	第76页