基于全文过滤的垃圾邮件防范机制

摘要	第1-6页
Abstract	第6-7页
第一章绪论	第7-12页
1、1 研究背景概述	第7-9页
1、2 论文的选题意义及工作论述	第9-12页
1、2、1 论文的选题意义	第9-10页
1、2、2 工作论述	第10-12页
第二章垃圾邮件的由来及过滤技术探讨	第12-22页
2、1 经济利益驱动下的垃圾邮件	第12-13页
2、2 邮件协议及其漏洞	第13-16页
2、2、1 电子邮件的工作原理	第13-14页
2、2、2 STMP协议及漏洞	第14-16页
2、2、3 Open Relay	第16页
2、3 垃圾邮件的常用过滤技术	第16-17页
2、3、1 关键字过滤	第16-17页
2、3、2 IP/黑白名单过滤	第17页
2、3、3 基于规则的垃圾邮件过滤技术	第17页
2、4 基于统计的过滤技术	第17-20页
2、5 邮件过滤与文本分类、信息过滤	第20-21页
2、6 垃圾邮件过滤技术小结	第21-22页
第三章单字的匹配方法的实现	第22-26页
3、1 正则表达式的形式	第22-23页
3、2 正则表达式的匹配模式	第23-24页
3、3 特征词的抽取	第24-25页
3、4 小结	第25-26页
第四章基于词匹配方法的概述	第26-30页
4、1 中文分词算法	第26-28页
4、1、1 基于字符串匹配的分词算法	第26-27页
4、1、2 基于统计的分词方法	第27-28页
4、1、3 基于理解的分词方法	第28页
4、1、4 分词的性能衡量	第28页
4、2 汉语自动分词小结	第28-30页
第五章全文过滤垃圾邮件防范机制的实现	第30-49页
5、1 邮件信息的获取	第31-32页
5、2 垃圾邮件文本过滤的实现	第32-47页
5、2、1 分词词典的构造	第32-36页
5、2、1、1 录入原则	第33页
5、2、1、2 数据结构	第33-36页
5、2、2 分词的预处理	第36-37页
5、2、3 分词的实现	第37-39页
5、2、4 特征向量的构造	第39-40页
5、2、5 歧义字段处理	第40-43页
5、2、5、1 混合型分词算法排歧	第41-42页
5、2、5、2 词性标注排歧法	第42-43页
5、2、6 未登录字段处理	第43页
5、2、7 邮件过滤的具体应用	第43-47页
5、3 算法的缺陷	第47-49页
第六章基于语义分析的进一步研究	第49-54页
6、1 语义分析的引入	第49-50页
6、2 实现方案	第50-53页
6、3 语义分析小结	第53-54页
第七章技术总结展望	第54-56页
7、1 总结	第54页
7、2 系统不足与展望	第54-56页
致谢	第56-57页
主要参考文献	第57-60页
附录一语义标注集	第60-62页
附录二 (攻读学位期间发表论文目录)	第62页