首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于MapReduce模型文本分类算法的研究

摘要第1-5页
ABSTRACT第5-11页
第1章 绪论第11-14页
   ·研究背景和意义第11页
   ·研究现状第11-12页
   ·研究内容及其组织结构第12-14页
第2章 MapReduce 模型及文本分类概述第14-21页
   ·MapReduce 模型第14-17页
     ·MapReduce 作业运行机制第14-16页
     ·MapReduce 中 shuffle 和排序第16-17页
   ·文本分类第17-20页
     ·特征选择方法第17-19页
     ·权重计算 TFIDF 改进方法第19-20页
   ·本章总结第20-21页
第3章 Hadoop 平台下倒排索引树的研究第21-36页
   ·数据处理思想第21-24页
     ·数据划分思想第21-22页
     ·数据抽样思想第22-23页
     ·数据变化思想第23-24页
     ·数据增量思想第24页
   ·倒排索引树并行化第24-31页
     ·倒排索引树结构第25-27页
     ·倒排索引树算法第27-30页
     ·倒排索引树剪枝策略第30-31页
   ·增量倒排索引树并行化第31-35页
     ·增量倒排索引树并行化设计第31-33页
     ·增量倒排索引树实现的关键技术第33-35页
   ·本章总结第35-36页
第4章 Hadoop 平台下基于倒排索引树的文本分类算法第36-56页
   ·文本预处理第36-38页
     ·算法输入要求第36-37页
     ·Map 阶段第37页
     ·Reduce 阶段第37-38页
   ·分类模型训练第38-39页
     ·Map 阶段第38页
     ·Reduce 阶段第38-39页
     ·训练模型生成阶段第39页
   ·训练样本获得第39-44页
     ·K-Means 算法主要思想第39-40页
     ·Hadoop 平台下 K-means 增量算法第40-42页
     ·Hadoop 平台下基于 MapReduce 的 Bagging 增量算法第42-44页
   ·贝叶斯算法第44-53页
     ·Hadoop 平台下基于倒排索引树的朴素贝叶斯算法第44-48页
     ·Hadoop 平台下基于倒排索引树的局部朴素贝叶斯算法第48-53页
   ·分类结果评价第53-55页
     ·Map 阶段第54页
     ·Reduce 阶段第54-55页
   ·本章总结第55-56页
第5章 实验与分析第56-65页
   ·实验环境搭建第56-59页
     ·集群机器环境配置第56-58页
     ·Hadoop 安装及其配置第58-59页
   ·实验结果分析第59-64页
     ·中英文数据集描述第59-60页
     ·算法性能分析第60-64页
   ·本章总结第64-65页
第6章 结论与展望第65-66页
   ·结论第65页
   ·展望第65-66页
致谢第66-67页
参考文献第67-69页
攻读硕士学位期间学术论文及科研情况第69-70页

论文共70页,点击 下载论文
上一篇:国美网上商城互动化传播策略研究
下一篇:面向分布式关系数据库的高效离群点挖掘算法研究