首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于随机森林和Spark的并行文本分类算法研究

摘要第6-7页
Abstract第7页
第1章 绪论第11-17页
    1.1 课题的背景及研究意义第11-12页
    1.2 国内外研究现状分析第12-15页
        1.2.1 文本分类国内外研究现状第12-14页
        1.2.2 粗糙集理论国内外研究现状第14-15页
        1.2.3 并行分类国内外研究现状第15页
    1.3 本文主要内容第15-16页
    1.4 论文结构第16-17页
第2章 文本分类相关概念和Spark分布式计算框架第17-31页
    2.1 文本分类技术第17-25页
        2.1.1 文本预处理第17-19页
        2.1.2 文本特征选择第19-21页
        2.1.3 文本表示第21-22页
        2.1.4 常用分类算法第22-23页
        2.1.5 分类性能评价第23-25页
    2.2 Spark分布式计算框架第25-29页
        2.2.1 Spark基本概念第25-27页
        2.2.2 Spark计算模型第27-29页
    2.3 粗糙集理论第29-30页
    2.4 本章小结第30-31页
第3章 基于粗糙集理论的随机森林算法第31-40页
    3.1 决策树算法基本概念第31-33页
    3.2 随机森林算法基本概念第33-34页
    3.3 基于差别矩阵的属性选择第34-35页
    3.4 随机森林文本分类算法第35-39页
        3.4.1 一种改进的文本处理方法第35-37页
        3.4.2 基于粗糙集理论的随机子空间第37-38页
        3.4.3 加权投票器第38-39页
    3.5 本章小结第39-40页
第4章 基于Spark的文本分类算法并行设计第40-55页
    4.1 文本处理模块并行设计第41-48页
        4.1.1 文本预处理并行设计第41-43页
        4.1.2 特征选择并行设计第43-45页
        4.1.3 文本表示并行设计第45-48页
    4.2 随机森林分类模块并行设计第48-54页
        4.2.1 差别矩阵属性选择并行设计第48-50页
        4.2.2 随机森林分类器并行设计第50-52页
        4.2.3 文本分类并行设计第52-54页
    4.3 本章小结第54-55页
第5章 实验分析与文本分类系统设计第55-67页
    5.1 实验结果及分析第55-62页
        5.1.1 实验环境第55页
        5.1.2 分类性能测试与分析第55-58页
        5.1.3 并行计算性能测试与分析第58-62页
    5.2 系统设计与实现第62-66页
        5.2.1 分类模型的构建与分类模块第62-64页
        5.2.2 数据下载管理模块第64-65页
        5.2.3 远程管理模块第65-66页
    5.3 本章小结第66-67页
总结与展望第67-68页
致谢第68-69页
参考文献第69-76页
攻读学位期间发表的论文第76页

论文共76页,点击 下载论文
上一篇:基于卷积神经网络的车牌智能识别系统的设计与实现
下一篇:整车物流监控与服务系统的设计与实现