首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Hadoop平台垃圾邮件过滤算法研究与实现

摘要第6-7页
abstract第7页
第1章 绪论第10-17页
    1.1 研究的背景及意义第10-12页
    1.2 国内外研究现状第12-14页
    1.3 研究的主要内容第14-15页
    1.4 论文组织结构第15-16页
    1.5 本章小结第16-17页
第2章 邮件过滤技术第17-30页
    2.1 数据挖掘关键技术研究第17-20页
        2.1.1 数据挖掘概述第17-18页
        2.1.2 数据挖掘发展历程第18页
        2.1.3 数据挖掘常用的方法第18-20页
    2.2 中文邮件文本信息预处理第20-23页
        2.2.1 中文分词的主要方法第20-22页
        2.2.2 特征词提取第22-23页
    2.3 Hadoop分布式平台分析第23-29页
        2.3.1 HDFS分布式文件系统分析第23-26页
        2.3.2 MapReduce框架分析第26-29页
    2.4 本章小结第29-30页
第3章 Hadoop平台贝叶斯算法分类研究第30-45页
    3.1 贝叶斯技术原理第30-33页
        3.1.1 贝叶斯技术历史概述第30页
        3.1.2 贝叶斯相关定义和公式第30-33页
    3.2 朴素贝叶斯文本分类第33-38页
        3.2.1 两种分类器第33-36页
        3.2.2 两种事件模型第36-38页
    3.3 朴素贝叶斯算法在邮件过滤中的应用第38-44页
        3.3.1 模型构建第38-39页
        3.3.2 朴素贝叶斯算法的优缺点第39-40页
        3.3.3 模型优化第40-44页
    3.4 本章小结第44-45页
第4章 Hadoop平台邮件过滤流程设计第45-59页
    4.1 MapReduce分布式编程模型第45页
    4.2 优化算法的MapReduce模型第45-52页
        4.2.1 朴素贝叶斯邮件过滤算法设计第45-47页
        4.2.2 MapReduce模型的邮件预处理模块第47-51页
        4.2.3 MapReduce模型的邮件训练模块第51-52页
        4.2.4 MapReduce模型的邮件过滤模块第52页
    4.3 实验环境搭建第52-58页
        4.3.1 Hadoop云计算平台第52-53页
        4.3.2 Hadoop平台搭建流程第53-58页
    4.4 本章小结第58-59页
第5章 实验结果及其分析第59-65页
    5.1 实验语料第59页
    5.2 数据评价指标第59-60页
    5.3 实验结果展示第60-62页
    5.4 实验结果分析第62-64页
    5.5 本章小结第64-65页
结论第65-67页
参考文献第67-71页
攻读硕士学位期间发表的论文和获得的科研成果第71-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:面向SOA蜜罐系统的数据捕获与分析方法的研究
下一篇:基于Powerlink协议解析的异常检测方法研究