首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop平台的文本分类系统的设计与实现

摘要第4-6页
Abstract第6-7页
缩略语第14-15页
第1章 绪论第15-21页
    1.1 课题研究背景和研究意义第15-16页
        1.1.1 研究背景第15-16页
    1.2 国内外研究现状第16-19页
        1.2.1 文本分类算法的研究现状第16-17页
        1.2.2 海量数据处理的研究现状第17-19页
    1.3 本文主要的研究内容第19页
    1.4 论文的组织第19-21页
第2章 Hadoop平台的研究第21-29页
    2.1 Hadoop平台概述第21-22页
        2.1.1 Hadoop平台的简介以及特点第21页
        2.1.2 Hadoop生态系统第21-22页
    2.2 HDFS第22-24页
        2.2.1 HDFS的相关概念第22-24页
    2.3 Map Reduce第24-27页
        2.3.1 Map Reduce设计原理第24-25页
        2.3.2 Map Reduce作业流程第25-27页
        2.3.3 Map Reduce的容错性第27页
    2.4 本章小结第27-29页
第3章 文本分类的基本原理第29-45页
    3.1 文本分类概述第29-30页
    3.2 文本预处理第30-31页
    3.3 文本表示第31-32页
        3.3.1 空间向量模型第31-32页
        3.3.2 权重计算第32页
        3.3.3 TFIDF算法第32页
    3.4 特征提取第32-35页
        3.4.1 文本频率第33页
        3.4.2 互信息第33-34页
        3.4.3 信息增益第34页
        3.4.4 卡方统计第34-35页
    3.5 基于Map Reduce的文本预处理方法实现第35-41页
        3.5.1 文本库预处理第35页
        3.5.2 文本库在HDFS中的存储形式第35-38页
        3.5.3 基于Map Reduce的特征选择算法第38-40页
        3.5.4 基于Map Reduce的TFIDF算法第40-41页
    3.6 本章实验第41-43页
    3.7 本章小结第43-45页
第4章 一种改进的SKNN文本分类算法研究第45-57页
    4.1 KNN分类算法概述第45-46页
    4.2 KNN算法的缺点第46页
    4.3 KNN算法的改进第46-47页
    4.4 基于子集的SKNN分类算法第47-50页
        4.4.1 算法思想概述第47-48页
        4.4.2 算法分析第48-50页
    4.5 基于子集的SKNN分类算法的改进第50-51页
    4.6 本章实验第51-55页
        4.6.1 硬件环境第51页
        4.6.2 软件环境第51-52页
        4.6.3 实验数据第52-53页
        4.6.4 模块设计第53页
        4.6.5 实验结果及分析第53-55页
    4.7 本章小结第55-57页
第5章 基于Hadoop平台的改进的SKNN文本分类算法设计与实现第57-71页
    5.1 系统架构第57-58页
    5.2 Hadoop集群及集群监控模块的搭建第58-61页
        5.2.1 硬件环境第58页
        5.2.2 软件环境第58页
        5.2.3 Hadoop系统结构第58-60页
        5.2.4 Hadoop集群环境配置第60-61页
        5.2.5 Hadoop集群的安装与配置第61页
    5.3 基于Hadoop平台的改进的SKNN分类算法的实现第61-64页
        5.3.1 算法实现分析第61-64页
    5.4 本章实验及分析第64-70页
        5.4.1 实验材料第64-65页
        5.4.2 改进的SKNN分类算法分类速度和准确率实验第65-67页
        5.4.3 参数K和S对改进的SKNN分类算法的影响第67-70页
    5.5 本章小结第70-71页
第6章 总结与展望第71-73页
    6.1 全文总结第71页
    6.2 工作展望第71-73页
致谢第73-75页
参考文献第75-79页
攻读硕士学位期间的研究成果第79页

论文共79页,点击 下载论文
上一篇:基于多源信息的高速公路交通事件检测方法研究
下一篇:基于Android客户端的车辆实时监测和诊断系统的研究与实现