摘要 | 第1-5页 |
Abstract | 第5-10页 |
第一章 概述 | 第10-16页 |
·课题研究背景及意义 | 第10-11页 |
·垃圾邮件的危害及当前状况 | 第11-13页 |
·垃圾邮件的定义及其危害 | 第11-12页 |
·我国垃圾邮件的当前状况 | 第12-13页 |
·垃圾邮件的过滤技术 | 第13-14页 |
·论文的创新点 | 第14-15页 |
·论文的内容安排 | 第15-16页 |
第二章 相关技术简介 | 第16-42页 |
·贝叶斯(Bayes)文本分类技术 | 第16-23页 |
·贝叶斯(Bayes)算法简介 | 第16-17页 |
·贝叶斯算法在垃圾邮件中的应用 | 第17-21页 |
·针对中文邮件的贝叶斯分类技术的研究 | 第21-23页 |
·中文分词的相关概念 | 第23-34页 |
·中文分词的概念、困难、意义及其在邮件过滤系统中的应用 | 第24-26页 |
·基于字符串匹配的分词 | 第26-31页 |
·基于统计的分词 | 第31-32页 |
·基于规则和基于统计相结合 | 第32页 |
·基于理解的分词 | 第32-33页 |
·分词算法总体评测 | 第33-34页 |
·特征选择相关概念及算法 | 第34-40页 |
·特征选择的概念及其算法 | 第35-37页 |
·特征选择算法评测 | 第37-38页 |
·关键字权重 | 第38-40页 |
·本章小结 | 第40-42页 |
第三章 垃圾邮件“不良信息”的识别 | 第42-60页 |
·垃圾邮件的演变 | 第42-45页 |
·对关键词填充垃圾邮件的研究 | 第45-49页 |
·对同音伪造关键字垃圾邮件的研究 | 第49-53页 |
·对变形关键字垃圾邮件的研究 | 第53-59页 |
·关联分析方法简介 | 第54-55页 |
·基于关联分析技术的潜在特征词挖掘方法 | 第55-59页 |
·本章小结 | 第59-60页 |
第四章 基于贝叶斯的垃圾邮件过滤系统 | 第60-96页 |
·邮件过滤系统的设计 | 第62-63页 |
·预处理模块 | 第63-67页 |
·邮件头预处理 | 第63-66页 |
·正文附件内容预处理 | 第66-67页 |
·数据词典的设计 | 第67-79页 |
·链表数据字典的设计 | 第67-69页 |
·二级哈希索引词典机制 | 第69-72页 |
·带词缀的索引词典机制 | 第72-76页 |
·三种词典机制的分析比较 | 第76-79页 |
·分词模块 | 第79-89页 |
·分词算法思想 | 第79-80页 |
·改进的基于字符串的分词算法 | 第80-84页 |
·未登录词的处理算法 | 第84-89页 |
·分词结果集筛选模块 | 第89-95页 |
·邮件协议分析 | 第90-91页 |
·去除停用词 | 第91-92页 |
·首次特征选择 | 第92-94页 |
·二次特征选择 | 第94-95页 |
·本章小结 | 第95-96页 |
第五章 测试 | 第96-106页 |
·系统的性能测试 | 第96-98页 |
·中文分词模块的性能测试 | 第98-103页 |
·特征选择模块的性能测试 | 第103-104页 |
·本章小节 | 第104-106页 |
第六章 总结与展望 | 第106-108页 |
·总结 | 第106-107页 |
·展望 | 第107-108页 |
参考文献 | 第108-111页 |
致谢 | 第111-112页 |
攻硕期间取得的研究成果 | 第112-113页 |