中文邮件过滤系统的研究与实现

摘要	第1-6页
Abstract	第6-12页
第一章绪论	第12-19页
·研究邮件分类的背景和意义	第12页
·当前主要的反垃圾邮件技术	第12-17页
·关键词过滤	第13页
·验证过滤器	第13页
·规则过滤器	第13-14页
·常用邮件内容过滤技术研究现状及存在问题	第14-17页
·本文研究的主要内容	第17页
·本文的组织结构	第17-19页
第二章中文垃圾邮件过滤系统中的关键技术	第19-27页
·中文词法分析	第19-20页
·分词算法描述	第20-21页
·基于字符串匹配的分词方法	第20页
·基于理解的分词方法	第20-21页
·基于统计的分词方法	第21页
·自动分词基本算法	第21-22页
·最大正向匹配算法描述(FMM算法)	第21页
·FMM算法举例	第21-22页
·算法评价	第22页
·常见分词算法比较	第22-23页
·N-最短路径方法	第23-27页
·粗切分	第23-24页
·N-最短路径	第24-27页
第三章中文垃圾邮件过滤系统中的特征项选择	第27-36页
·文本的表示	第27页
·向量空间模型	第27-28页
·常见的中文特征项选择	第28-31页
·特征表示	第28-29页
·特征提取	第29-31页
·基于粗集约简的特征提取	第31-36页
·粗糙集(Rough Set)理论	第31-33页
·约简粗集的特征选取	第33-36页
第四章中文垃圾邮件过滤系统模拟及分析	第36-53页
·现有的基于文本挖掘的邮件分类技术	第36页
·邮件自身的特点	第36页
·贝叶斯分类技术	第36-39页
·贝叶斯定理(Bayes)	第36-37页
·朴素贝叶斯分类(Naive Bayes)	第37-38页
·贝叶斯信念网络	第38页
·树状贝叶斯网络(Tree Angmented Naive Bayes)	第38-39页
·基于粗集属性约简的贝叶斯中文邮件分类的系统设计	第39-47页
·总体设计思想	第39-40页
·邮件预处理	第40-43页
·特征项选取	第43-45页
·基于依赖性的属性约简的贝叶斯邮件分类技术	第45-47页
·模拟和分析	第47-48页
·实例分析的重要性	第47页
·评估方法	第47-48页
·模拟系统的构建	第48-53页
·系统需要的数据准备	第48-49页
·测试所需环境	第49页
·实验结果	第49-52页
·实验总结	第52-53页
第五章总结与展望	第53-55页
·总结	第53页
·创新与不足	第53页
·展望	第53-55页
参考文献	第55-57页
攻读硕士学位期间发表的论文	第57页