并行化文本分类算法研究

摘要	第3-4页
Abstract	第4-5页
第1章绪论	第8-15页
1.1 研究背景及意义	第8-10页
1.1.1 研究背景	第8-9页
1.1.2 研究意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 文本分类研究现状	第10-11页
1.2.2 并行分布式计算的研究现状	第11-12页
1.3 研究内容及创新点	第12-13页
1.3.1 研究内容	第12-13页
1.3.2 论文主要创新点	第13页
1.4 论文结构	第13-14页
1.5 本章小结	第14-15页
第2章相关技术概述	第15-26页
2.1 文本分类概述	第15-22页
2.1.1 文本分类关键技术	第16-20页
2.1.2 文本分类算法	第20-22页
2.2 Spark并行分布式计算框架	第22-25页
2.2.1 Spark生态系统与运行架构	第22-23页
2.2.2 Spark核心基础RDD	第23-25页
2.3 本章小结	第25-26页
第3章 Spark框架下基于聚类裁剪的KNN文本分类算法	第26-36页
3.1 优化KNN分类算法的并行化	第26-31页
3.1.1 基于聚类裁剪的KNN分类算法	第26-27页
3.1.2 KNN算法的并行化	第27-31页
3.2 KNN并行化文本分类算法时间复杂度分析	第31页
3.3 实验设计与结果分析	第31-35页
3.3.1 实验环境与数据集	第31-32页
3.3.2 实验结果分析	第32-35页
3.4 本章小结	第35-36页
第4章 Spark框架下基于词语相关度的KNN文本分类算法	第36-44页
4.1 词语相关度概念	第36-37页
4.2 Spark框架下基于词语相关度的KNN文本分类算法	第37-39页
4.2.1 基于词语相关度的文本相似度计算	第37页
4.2.2 Spark框架下基于词语相关度的并行化KNN算法	第37-39页
4.3 实验设计与结果分析	第39-43页
4.3.1 实验环境与数据集	第39-40页
4.3.2 评价指标	第40页
4.3.3 实验结果分析	第40-43页
4.4 本章小结	第43-44页
第5章总结与展望	第44-46页
5.1 总结	第44页
5.2 展望	第44-46页
参考文献	第46-49页
在读期间发表的学术论文及研究成果	第49-50页
致谢	第50页