首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于文本分类技术的垃圾邮件过滤研究

摘要第3-5页
Abstract第5-6页
第一章 绪论第9-18页
    一、垃圾邮件概述第9-11页
        (一) 垃圾邮件的定义第9页
        (二) 垃圾邮件的特征第9-10页
        (三) 垃圾邮件的危害第10-11页
    二、选题背景和研究意义第11-12页
    三、国内外研究现状第12-15页
        (一) 基于信件源的垃圾邮件过滤技术第12页
        (二) 基于规则的垃圾邮件过滤技术第12-13页
        (三) 基于统计的垃圾邮件过滤技术第13-15页
    四、主要研究内容及组织安排第15-16页
        (一) 研究内容第15页
        (二) 组织安排第15-16页
    五、本文的创新点第16-18页
第二章 文本分类的关键技术第18-30页
    一、文本预处理第18-19页
    二、文本特征提取第19-20页
    三、基于互信息的特征提取方法的改进第20-24页
    四、文本表示方法第24-25页
    五、垃圾邮件过滤中常用的文本分类技术第25-30页
        (一) 决策树第26-27页
        (二) 朴素贝叶斯分类第27页
        (三) 支持向量机分类第27-28页
        (四) K近邻(K-Nearst Neighbour)分类第28-29页
        (五) K均值聚类方法第29-30页
第三章 朴素贝叶斯的理论概述及改进第30-39页
    一、贝叶斯定理第30页
    二、朴素贝叶斯分类第30-32页
    三、朴素贝叶斯分类模型参数估计第32-33页
    四、朴素贝叶斯模型选择第33-35页
    五、伯努利朴素贝叶斯在垃圾邮件分类中的示例第35-37页
    六、隐朴素贝叶斯第37-39页
第四章 垃圾邮件过滤的实证研究第39-54页
    一、语料库第39-42页
        (一) 英文语料库第39-41页
        (二) 中文语料库第41页
        (三) 研究样本选择第41-42页
    二、分类结果的性能评价第42-45页
        (一) 评价方法第42页
        (二) 性能评价标准第42-45页
    三、模型的建立与分析第45页
    四、模型结果分析第45-54页
        (一) 实验一第45-48页
        (二) 实验二第48页
        (三) 实验三第48-50页
        (四) 实验四第50-51页
        (五) 实验五第51-54页
第五章 总结及展望第54-55页
参考文献第55-58页
附录A 特征词第58-63页
    一、垃圾邮件特征词第58-60页
    二、正常邮件特征词第60-63页
致谢第63-64页
在读期间发表的学术论文与取得的研究成果第64页

论文共64页,点击 下载论文
上一篇:不同负荷方案的耐力型间歇训练对大学生中长跑运动员专项耐力特征的影响研究
下一篇:通背功对长春市中学生体质影响的实验研究