首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于内容的垃圾邮件过滤技术研究

摘要第3-4页
Abstract第4-5页
1 绪论第9-17页
    1.1 研究背景及意义第9-11页
    1.2 国内外研究现状第11-15页
        1.2.1 法律法规的建立第11-12页
        1.2.2 电子邮件协议的改进第12页
        1.2.3 接收端过滤技术第12-15页
    1.3 本文的主要工作第15-16页
    1.4 本文的组织结构第16-17页
2 基于内容的垃圾邮件过滤技术综述第17-31页
    2.1 电子邮件的结构第17-19页
    2.2 基于内容的的垃圾邮件过滤系统流程第19-20页
    2.3 特征表示第20-22页
        2.3.1 分词第20-21页
        2.3.2 去停用词第21页
        2.3.3 文本表示第21-22页
    2.4 降维方法第22-25页
        2.4.1 特征选择第22-24页
        2.4.2 特征抽取第24-25页
    2.5 分类方法第25-27页
    2.6 评价标准第27-29页
    2.7 本章小结第29-31页
3 基于间隔式滑动窗口的中文分词方法第31-40页
    3.1 邮件文本现状第31页
    3.2 常用的中文分词方法第31-34页
        3.2.1 词典分词方法第32-33页
        3.2.2 理解分词方法第33-34页
        3.2.3 统计分词方法第34页
        3.2.4 组合分词方法第34页
    3.3 基于间隔式滑动窗口的分词方法第34-38页
        3.3.1 滑动窗口技术第35-36页
        3.3.2 间隔式滑动窗口分词方法第36-38页
    3.4 实验第38-39页
        3.4.1 实验环境第38页
        3.4.2 数据集第38页
        3.4.3 实验及结果分析第38-39页
    3.5 本章小结第39-40页
4 基于特征贡献比的互信息特征选择方法第40-49页
    4.1 文本特征降维分析第40-41页
    4.2 邮件特征选择的特点第41-43页
    4.3 基于特征贡献比的互信息特征选择方法第43-46页
        4.3.1 互信息特征选择方法第43-44页
        4.3.2 改进的互信息特征选择方法第44-46页
    4.4 实验第46-48页
        4.4.1 实验环境第46页
        4.4.2 数据集第46页
        4.4.3 实验及结果分析第46-48页
    4.5 本章小结第48-49页
5 改进的ROC-SVM算法第49-62页
    5.1 数据不均衡性及其常用的处理方法第49-50页
        5.1.1 改进分类算法第49-50页
        5.1.2 重构数据集第50页
    5.2 ROC-SVM算法第50-54页
        5.2.1 WMW统计量第51页
        5.2.2 AUC值第51-52页
        5.2.3 ROC-SVM算法第52-54页
    5.3 改进的ROC-SVM算法第54-58页
        5.3.1 L_1范数正则化第55-56页
        5.3.2 L_1范数正则化ROC-SVM第56-58页
    5.4 实验第58-61页
        5.4.1 实验环境第58页
        5.4.2 数据集第58页
        5.4.3 实验及结果分析第58-61页
    5.5 本章小结第61-62页
6 总结与展望第62-64页
    6.1 本文工作总结第62-63页
    6.2 进一步的工作展望第63-64页
参考文献第64-69页
致谢第69-71页
攻读硕士期间完成的学术论文和科研项目第71-73页
    一、发表学术论文第71页
    二、参加科研项目第71-73页

论文共73页,点击 下载论文
上一篇:企业绩效评价研究
下一篇:伊宁地块科古琴-乌拉斯台地区石炭纪火山岩地球化学特征及对比