| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第一章 概述 | 第10-16页 |
| ·课题研究背景及意义 | 第10-11页 |
| ·垃圾邮件的危害及当前状况 | 第11-13页 |
| ·垃圾邮件的定义及其危害 | 第11-12页 |
| ·我国垃圾邮件的当前状况 | 第12-13页 |
| ·垃圾邮件的过滤技术 | 第13-14页 |
| ·论文的创新点 | 第14-15页 |
| ·论文的内容安排 | 第15-16页 |
| 第二章 相关技术简介 | 第16-42页 |
| ·贝叶斯(Bayes)文本分类技术 | 第16-23页 |
| ·贝叶斯(Bayes)算法简介 | 第16-17页 |
| ·贝叶斯算法在垃圾邮件中的应用 | 第17-21页 |
| ·针对中文邮件的贝叶斯分类技术的研究 | 第21-23页 |
| ·中文分词的相关概念 | 第23-34页 |
| ·中文分词的概念、困难、意义及其在邮件过滤系统中的应用 | 第24-26页 |
| ·基于字符串匹配的分词 | 第26-31页 |
| ·基于统计的分词 | 第31-32页 |
| ·基于规则和基于统计相结合 | 第32页 |
| ·基于理解的分词 | 第32-33页 |
| ·分词算法总体评测 | 第33-34页 |
| ·特征选择相关概念及算法 | 第34-40页 |
| ·特征选择的概念及其算法 | 第35-37页 |
| ·特征选择算法评测 | 第37-38页 |
| ·关键字权重 | 第38-40页 |
| ·本章小结 | 第40-42页 |
| 第三章 垃圾邮件“不良信息”的识别 | 第42-60页 |
| ·垃圾邮件的演变 | 第42-45页 |
| ·对关键词填充垃圾邮件的研究 | 第45-49页 |
| ·对同音伪造关键字垃圾邮件的研究 | 第49-53页 |
| ·对变形关键字垃圾邮件的研究 | 第53-59页 |
| ·关联分析方法简介 | 第54-55页 |
| ·基于关联分析技术的潜在特征词挖掘方法 | 第55-59页 |
| ·本章小结 | 第59-60页 |
| 第四章 基于贝叶斯的垃圾邮件过滤系统 | 第60-96页 |
| ·邮件过滤系统的设计 | 第62-63页 |
| ·预处理模块 | 第63-67页 |
| ·邮件头预处理 | 第63-66页 |
| ·正文附件内容预处理 | 第66-67页 |
| ·数据词典的设计 | 第67-79页 |
| ·链表数据字典的设计 | 第67-69页 |
| ·二级哈希索引词典机制 | 第69-72页 |
| ·带词缀的索引词典机制 | 第72-76页 |
| ·三种词典机制的分析比较 | 第76-79页 |
| ·分词模块 | 第79-89页 |
| ·分词算法思想 | 第79-80页 |
| ·改进的基于字符串的分词算法 | 第80-84页 |
| ·未登录词的处理算法 | 第84-89页 |
| ·分词结果集筛选模块 | 第89-95页 |
| ·邮件协议分析 | 第90-91页 |
| ·去除停用词 | 第91-92页 |
| ·首次特征选择 | 第92-94页 |
| ·二次特征选择 | 第94-95页 |
| ·本章小结 | 第95-96页 |
| 第五章 测试 | 第96-106页 |
| ·系统的性能测试 | 第96-98页 |
| ·中文分词模块的性能测试 | 第98-103页 |
| ·特征选择模块的性能测试 | 第103-104页 |
| ·本章小节 | 第104-106页 |
| 第六章 总结与展望 | 第106-108页 |
| ·总结 | 第106-107页 |
| ·展望 | 第107-108页 |
| 参考文献 | 第108-111页 |
| 致谢 | 第111-112页 |
| 攻硕期间取得的研究成果 | 第112-113页 |