基于全文过滤的垃圾邮件防范机制
摘要 | 第1-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第7-12页 |
1、1 研究背景概述 | 第7-9页 |
1、2 论文的选题意义及工作论述 | 第9-12页 |
1、2、1 论文的选题意义 | 第9-10页 |
1、2、2 工作论述 | 第10-12页 |
第二章 垃圾邮件的由来及过滤技术探讨 | 第12-22页 |
2、1 经济利益驱动下的垃圾邮件 | 第12-13页 |
2、2 邮件协议及其漏洞 | 第13-16页 |
2、2、1 电子邮件的工作原理 | 第13-14页 |
2、2、2 STMP协议及漏洞 | 第14-16页 |
2、2、3 Open Relay | 第16页 |
2、3 垃圾邮件的常用过滤技术 | 第16-17页 |
2、3、1 关键字过滤 | 第16-17页 |
2、3、2 IP/黑白名单过滤 | 第17页 |
2、3、3 基于规则的垃圾邮件过滤技术 | 第17页 |
2、4 基于统计的过滤技术 | 第17-20页 |
2、5 邮件过滤与文本分类、信息过滤 | 第20-21页 |
2、6 垃圾邮件过滤技术小结 | 第21-22页 |
第三章 单字的匹配方法的实现 | 第22-26页 |
3、1 正则表达式的形式 | 第22-23页 |
3、2 正则表达式的匹配模式 | 第23-24页 |
3、3 特征词的抽取 | 第24-25页 |
3、4 小结 | 第25-26页 |
第四章 基于词匹配方法的概述 | 第26-30页 |
4、1 中文分词算法 | 第26-28页 |
4、1、1 基于字符串匹配的分词算法 | 第26-27页 |
4、1、2 基于统计的分词方法 | 第27-28页 |
4、1、3 基于理解的分词方法 | 第28页 |
4、1、4 分词的性能衡量 | 第28页 |
4、2 汉语自动分词小结 | 第28-30页 |
第五章 全文过滤垃圾邮件防范机制的实现 | 第30-49页 |
5、1 邮件信息的获取 | 第31-32页 |
5、2 垃圾邮件文本过滤的实现 | 第32-47页 |
5、2、1 分词词典的构造 | 第32-36页 |
5、2、1、1 录入原则 | 第33页 |
5、2、1、2 数据结构 | 第33-36页 |
5、2、2 分词的预处理 | 第36-37页 |
5、2、3 分词的实现 | 第37-39页 |
5、2、4 特征向量的构造 | 第39-40页 |
5、2、5 歧义字段处理 | 第40-43页 |
5、2、5、1 混合型分词算法排歧 | 第41-42页 |
5、2、5、2 词性标注排歧法 | 第42-43页 |
5、2、6 未登录字段处理 | 第43页 |
5、2、7 邮件过滤的具体应用 | 第43-47页 |
5、3 算法的缺陷 | 第47-49页 |
第六章 基于语义分析的进一步研究 | 第49-54页 |
6、1 语义分析的引入 | 第49-50页 |
6、2 实现方案 | 第50-53页 |
6、3 语义分析小结 | 第53-54页 |
第七章 技术总结展望 | 第54-56页 |
7、1 总结 | 第54页 |
7、2 系统不足与展望 | 第54-56页 |
致谢 | 第56-57页 |
主要参考文献 | 第57-60页 |
附录一 语义标注集 | 第60-62页 |
附录二 (攻读学位期间发表论文目录) | 第62页 |