基于文本分类的反垃圾邮件技术研究

摘要	第1-5页
ABSTRACT	第5-11页
第一章引言	第11-17页
·什么是垃圾邮件	第11-12页
·垃圾邮件的危害	第12-13页
·垃圾邮件对网络造成了严重的破坏	第12页
·垃圾邮件感染网络甚至破坏网络	第12页
·垃圾邮件会影响企业的运作	第12-13页
·垃圾邮件会严重损害国家利益	第13页
·反垃圾邮件的发展	第13-14页
·国内外研究现状	第14页
·课题研究背景和意义	第14-15页
·课题的研究背景	第14-15页
·课题的研究意义	第15页
·论文的结构和主要工作	第15-16页
·论文的结构	第15-16页
·主要工作	第16页
·本章小结	第16-17页
第二章电子邮件和反垃圾邮件技术	第17-24页
·电子邮件概述	第17-19页
·电子邮件的工作原理	第17页
·电子邮件的主要协议	第17-19页
·邮件过滤类型	第19-20页
·MTA 过滤方式	第19-20页
·MDA 过滤	第20页
·MUA 过滤	第20页
·反垃圾邮件技术	第20-23页
·基础MTA 控制	第21页
·关键词过滤	第21-22页
·黑白名单	第22页
·HASH 技术	第22页
·智能和概率系统	第22页
·发送方认证技术	第22-23页
·本章小结	第23-24页
第三章反垃圾邮件平台设计	第24-30页
·项目部署	第24-25页
·反垃圾邮件体系	第25-29页
·反垃圾邮件体系结构	第25-26页
·iptables 规则	第26-27页
·反垃圾体系流程	第27-28页
·垃圾邮件的处理	第28-29页
·本章小结	第29-30页
第四章中文分词的研究与实现	第30-50页
·问题提出	第30页
·字符编码	第30-33页
·GB2312 编码	第30-31页
·GBK 编码	第31页
·Unicode 编码	第31-32页
·BIG5 编码	第32-33页
·中文分词的研究现状	第33-37页
·基于字符串匹配的分词方法	第33-35页
·基于理解的分词方法	第35页
·基于统计的分词方法	第35-36页
·分词难点	第36-37页
·分词中的词典机制	第37-40页
·基于Trie 树的词典机制	第37-38页
·基于PATRICIA tree 的词典机制	第38-39页
·基于整词二分的词典机制	第39页
·双层hash 词典机制	第39-40页
·中文分词路径算法模型	第40-44页
·Dijkstra 最短路径算法	第41-42页
·Floyed 算法模型	第42页
·k-最短路径算法模型	第42-44页
·中文分词模块的设计与实现	第44-49页
·预处理模块	第45页
·基于统计的分词模块	第45-46页
·基于词典的分词模块	第46页
·歧义处理模块	第46-47页
·测试及分析	第47-49页
·本章小结	第49-50页
第五章文本相似度的改进及实现	第50-58页
·Levenshtein 距离相似度分类实现	第50-52页
·基于文本向量特征距离的相似度邮件的实现及改进	第52-55页
·算法性能分析及实验数据对比分析	第55-57页
·本章小结	第57-58页
第六章贝叶斯过滤算法的改进及实现	第58-71页
·朴素贝叶斯分类的实现	第58-64页
·相关概念	第58页
·朴素贝叶斯模型理论及学习过程的实现	第58-63页
·贝叶斯分类器的实现	第63-64页
·改进的贝叶斯算法	第64-70页
·贝叶斯公式的变形	第65-66页
·贝叶斯网络	第66-67页
·三层贝叶斯网络模型的形成过程	第67-69页
·性能及实验数据对比分析	第69-70页
·本章小结	第70-71页
第七章总结与展望	第71-74页
·本论文研究总结	第71-72页
·前景展望	第72-74页
致谢	第74-75页
参考文献	第75-78页
攻硕期间取得的研究成果	第78-79页