首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Spark的超大文本分类方法的设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第11-19页
    1.1 研究背景及意义第11-12页
    1.2 研究现状第12-15页
        1.2.1 文本表示的研究现状第12-13页
        1.2.2 分类器的研究现状第13-14页
        1.2.3 Spark发展现状第14-15页
    1.3 本文主要研究内容第15-17页
        1.3.1 对文本表示算法的改进第15-16页
        1.3.2 文本分类器的设计第16-17页
        1.3.3 OFFS-BP神经网络分类器与Spark框架的融合第17页
    1.4 本文结构第17-19页
2 基础理论与关键技术第19-35页
    2.1 文本分类算法第19-29页
        2.1.1 文本预处理第20-21页
        2.1.2 文本表示第21-24页
        2.1.3 分类器设计第24-29页
    2.2 SPARK计算框架第29-34页
        2.2.1 Spark Core第31页
        2.2.2 Spark MLlib第31-33页
        2.2.3 Spark Streaming第33-34页
        2.2.4 Spark Graphx第34页
    2.3 本章总结第34-35页
3 基于流数据的文本分类方法设计第35-58页
    3.1 文本表示算法第35-44页
        3.1.1 OFFS文本表示算法模型的构建第35-36页
        3.1.2 分域的策略第36-38页
        3.1.3 在线特征提取第38-42页
        3.1.4 特征的权重计算第42-44页
    3.2 BP神经网络分类器设计第44-50页
        3.2.1 神经网络模型第45-46页
        3.2.2 输入信号的处理第46-48页
        3.2.3 神经网络模型的训练第48-50页
    3.3 分类性能测试实验第50-57页
        3.3.1 OFFS算法性能测试实验第50-54页
        3.3.2 OFFS-BP神经网络分类器性能测试实验第54-57页
    3.4 本章总结第57-58页
4 基于SPARK平台的OFFS-BP神经网络文本分类器的实现第58-69页
    4.1 系统架构设计第58-59页
    4.2 SPARK环境搭建第59-62页
        4.2.1 Linux下Spark运行环境的配置第60-62页
        4.2.2 Spark开发环境安装第62页
    4.3 OFFS算法在SPARK STREAMING中的实现第62-65页
        4.3.1 Spark Streaming编程模型第63页
        4.3.2 OFFS算法在Spark Streaming中的实现第63-65页
    4.4 神经网络在SPARK MLLIB中的实现第65-68页
    4.5 本章总结第68-69页
5 总结与展望第69-70页
参考文献第70-73页
作者简历及攻读硕士学位期间取得的研究成果第73-75页
学位论文数据集第75页

论文共75页,点击 下载论文
上一篇:HBase多条件复杂查询的实现方法研究
下一篇:无模型自适应控制在无人驾驶汽车中的应用