首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Spark平台的垃圾短信过滤系统的研究与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-17页
    1.1 研究背景第10页
    1.2 垃圾短信概述第10-13页
        1.2.1 垃圾短信定义及分类第10-11页
        1.2.2 垃圾短信特征第11-12页
        1.2.3 垃圾短信危害第12-13页
    1.3 前人工作综述和研究意义第13-15页
    1.4 本文主要研究内容第15-16页
    1.5 本文的组织结构第16-17页
第二章 相关技术综述第17-28页
    2.1 文本分类技术第17-21页
        2.1.1 文本预处理第17-18页
        2.1.2 文本清洗与去噪第18页
        2.1.3 特征降维第18-19页
        2.1.4 文本分类第19-21页
    2.2 Simhash简介第21-23页
        2.2.1 Simhash原理第21-22页
        2.2.2 分块检索第22-23页
    2.3 Hadoop简介第23-25页
        2.3.1 HDFS第23-24页
        2.3.2 MapReduce编程模型第24-25页
    2.4 Spark简介第25-27页
        2.4.1 RDD弹性分布式数据集第26-27页
        2.4.2 Spark资源管理和编程抽象第27页
    2.5 本章小结第27-28页
第三章 串行垃圾短信过滤系统的分析与设计第28-45页
    3.1 系统需求分析与设计第28-29页
        3.1.1 系统需求分析第28页
        3.1.2 系统设计第28-29页
    3.2 短信处理模块第29-33页
        3.2.1 正则匹配第30-31页
        3.2.2 特征提取技术的选择第31-32页
        3.2.3 去噪处理第32-33页
    3.3 Simhash模块第33页
    3.4 特性判定模块第33-36页
        3.4.1 内容特性第33-35页
        3.4.2 回联特性第35-36页
        3.4.3 判定模型第36页
    3.5 贝叶斯分类器模块第36-39页
        3.5.1 分类模型的选择第36-37页
        3.5.2 增强的多变量伯努利模型第37-38页
        3.5.3 模块设计第38-39页
    3.6 实验与分析第39-44页
        3.6.1 实验环境第39页
        3.6.2 特性判定模块实验第39-40页
        3.6.3 Simhash&贝叶斯分类模块实验第40-44页
    3.7 本章小结第44-45页
第四章 垃圾短信过滤系统的并行优化第45-60页
    4.1 设计原则第45-47页
        4.1.1 适用性第45页
        4.1.2 可扩展性第45-46页
        4.1.3 有效性第46-47页
        4.1.4 并行第47页
    4.2 垃圾短信过滤系统的并行设计第47-48页
    4.3 并行策略提取模块第48-49页
        4.3.1 并行策略提取模块第48-49页
        4.3.2 并行策略提取模块实现第49页
    4.4 并行特性判定模块第49-50页
    4.5 并行朴素贝叶斯模块第50-53页
        4.5.1 并行朴素贝叶斯算法第50-51页
        4.5.2 并行朴素贝叶斯算法的实现第51-53页
    4.6 实验与分析第53-59页
        4.6.1 实验环境及系统架构部署第53-55页
        4.6.2 实验及结果分析第55-59页
    4.7 本章小结第59-60页
第五章 总结与展望第60-62页
    5.1 总结第60-61页
    5.2 展望第61-62页
参考文献第62-65页
致谢第65-66页
攻读硕士期间发表的学术论文第66页

论文共66页,点击 下载论文
上一篇:2D转3D视频中深度信息处理与空洞填充的研究
下一篇:基于云计算的影视大数据处理关键问题研究与实现