首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的分布式文本分类研究

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-12页
   ·课题研究背景及意义第8-9页
   ·国内外研究现状第9-10页
     ·文本分类研究现状第9页
     ·Hadoop 分布式计算研究现状第9-10页
   ·论文主要内容第10-11页
   ·论文组织和结构第11-12页
第2章 文本分类及 Hadoop 平台分析第12-26页
   ·文本分类关键技术研究第12-19页
     ·文本分类概述第12-14页
     ·文本预处理第14-15页
     ·文本表示模型第15-16页
     ·文本特征降维第16-18页
     ·文本分类模型第18-19页
   ·Hadoop 分布式计算平台分析第19-25页
     ·HDFS 分布式文件系统分析第20-22页
     ·MapReduce 并行计算框架分析第22-25页
   ·本章小结第25-26页
第3章 基于 Hadoop 的分布式文本分类研究第26-56页
   ·文本分类中的问题分析第26-27页
   ·分布式文本分类总体设计第27-30页
     ·分布式并行算法设计的关键第27-28页
     ·分布式文本分类流程第28-30页
   ·文本的分布式预处理研究第30-34页
     ·分布式预处理流程第30-31页
     ·预处理的 MapReduce 分解第31-34页
   ·特征选择的分布式计算研究第34-39页
     ·特征选择算法分析第34-36页
     ·特征选择的分布式计算第36-39页
   ·文本向量化的分布式计算研究第39-45页
     ·TFIDF 权重计算第40-41页
     ·TFIDF 权重的分布式计算第41-45页
   ·BP 网络文本分类研究第45-54页
     ·BP 网络模型分析第45-46页
     ·BP 网络文本分类器设计第46-49页
     ·BP 网络分布式并行训练第49-54页
     ·BP 网络分布式文本分类第54页
   ·本章小结第54-56页
第4章 分布式文本分类实验及分析第56-68页
   ·实验语料第56页
   ·评价指标第56-57页
   ·实验环境搭建第57-60页
     ·实验环境第57-59页
     ·系统部署第59-60页
   ·各模块设计第60-62页
   ·实验结果分析第62-67页
     ·文本前期处理第62-64页
     ·BP 网络训练第64-65页
     ·文本分类结果第65-67页
   ·本章小结第67-68页
结论第68-69页
参考文献第69-74页
攻读硕士学位期间所发表的学术论文第74-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:专利展示交易信息服务发布系统设计与实现
下一篇:基于Struts和Hibernate的购物系统后台及其安全的研究与实现