首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的SKNN文本分类算法的设计与实现

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-14页
   ·课题研究背景及意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·国内外研究现状第11-12页
   ·研究内容和主要工作第12-13页
   ·论文组织结构第13-14页
第二章 Hadoop平台和文本分类概述第14-23页
   ·Hadoop概述第14-18页
     ·MapRduce第15-16页
     ·HDFS第16-18页
   ·Hadoop平台搭建第18-20页
   ·文本分类概述第20-22页
   ·本章小结第22-23页
第三章 基于MapReduce的文本预处理方法第23-36页
   ·文本预处理流程第23-25页
     ·文本集合第23-24页
     ·中文分词和去停用词第24页
     ·特征选择第24-25页
     ·文本表示第25页
   ·基于MapReduce的文本预处理方法实现第25-32页
     ·语料库预处理第26页
     ·语料库在HDFS中的存储策略第26-28页
     ·基于MapReduce的特征选择算法第28-31页
     ·基于MapReduce的TFIDF算法第31-32页
   ·实验结果及分析第32-35页
   ·本章小结第35-36页
第四章 基于MapReduce的SKNN分类算法第36-52页
   ·KNN分类算法第36-38页
     ·KNN分类算法概述第36-37页
     ·KNN分类算法的改进第37-38页
   ·划分子类的SKNN分类算法第38-42页
     ·算法的基本思想第38-40页
     ·算法正确性分析第40-41页
     ·算法时间复杂度分析第41-42页
   ·基于MapReduce的SKNN分类算法实现第42-45页
   ·实验结果及分析第45-51页
     ·SKNN分类算法准确度和分类速度测试实验第45-47页
     ·参数K和S对SKNN分类结果的影响实验第47-50页
     ·Hadoop上SKNN的性能测试实验第50-51页
   ·本章小结第51-52页
第五章 总结与展望第52-54页
   ·全文总结第52-53页
   ·研究展望第53-54页
参考文献第54-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:电子双板中双屏分屏器的USB模块设计与研究
下一篇:互联网广告精准投放平台的研究