首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce的KNN分类算法的研究与实现

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 引言第11-18页
   ·课题研究的背景第11-12页
   ·课题研究的目的及意义第12页
   ·课题的研究现状及其发展趋势第12-16页
     ·KNN算法进行文本分类的发展过程研究现状第12-15页
     ·MapReduce技术现状及其发展趋势第15-16页
   ·论文的组织结构第16-18页
2 MapReduce技术概述第18-33页
   ·MapReduce技术简介第18-21页
     ·MapReduce技术的基本原理第18-19页
     ·MapReduce任务的执行过程第19-21页
   ·MapReduce架构优势第21-24页
     ·容错性实现机制第21-23页
     ·MapReduce任务相关操作实现机制第23-24页
   ·MapReduce相关技术解析第24-32页
     ·MapReduce中Shuffle和Sort操作第24-27页
     ·MapReduce二次排序操作第27-32页
   ·总结第32-33页
3 KNN分类算法第33-41页
   ·文本自动分类过程的概述第33-36页
     ·文本自动分类的基本过程第33-34页
     ·KNN算法分类思想第34-36页
   ·基于KNN算法分类过程描述第36-39页
     ·KNN算法的分类过程第36-38页
     ·改进的KNN的分类过程第38-39页
   ·KNN评估方法第39-40页
   ·总结第40-41页
4 MapReduce实现KNN算法的过程第41-61页
   ·预处理训练集文档的MapReduce过程第41-46页
     ·样本文档预处理过程第42-44页
     ·特征向量化样本文档的MapReduce实现第44-46页
   ·特征向量化未分类文档的MapReduce实现第46-52页
     ·MapReduce实现未分类文档分词处理操作第46-50页
     ·Map和Reduce数据类型处理过程第50-52页
   ·MapReduce实现KNN自动分类第52-60页
     ·余弦定理的MapReduce实现第53-58页
     ·KNN分类过程的MapReduce实现第58-60页
   ·本章小结第60-61页
5 实验和分析第61-75页
   ·基于小规模数据实验分析第61-69页
     ·实验环境第61-62页
     ·实验过程第62-68页
     ·KNN的java实现第68-69页
   ·基于大规模文档实验分析第69-74页
     ·对比实验第69-71页
     ·实验结果分析第71-74页
   ·本章小结第74-75页
6 总结与展望第75-77页
参考文献第77-79页
附录A第79-81页
作者简历第81-83页
学位论文数据集第83页

论文共83页,点击 下载论文
上一篇:企业集团合并财务报表系统的设计与实现
下一篇:分析报告开放平台的设计与实现