| 摘要 | 第1-6页 |
| Abstract | 第6-12页 |
| 第一章 绪论 | 第12-19页 |
| ·研究邮件分类的背景和意义 | 第12页 |
| ·当前主要的反垃圾邮件技术 | 第12-17页 |
| ·关键词过滤 | 第13页 |
| ·验证过滤器 | 第13页 |
| ·规则过滤器 | 第13-14页 |
| ·常用邮件内容过滤技术研究现状及存在问题 | 第14-17页 |
| ·本文研究的主要内容 | 第17页 |
| ·本文的组织结构 | 第17-19页 |
| 第二章 中文垃圾邮件过滤系统中的关键技术 | 第19-27页 |
| ·中文词法分析 | 第19-20页 |
| ·分词算法描述 | 第20-21页 |
| ·基于字符串匹配的分词方法 | 第20页 |
| ·基于理解的分词方法 | 第20-21页 |
| ·基于统计的分词方法 | 第21页 |
| ·自动分词基本算法 | 第21-22页 |
| ·最大正向匹配算法描述(FMM算法) | 第21页 |
| ·FMM算法举例 | 第21-22页 |
| ·算法评价 | 第22页 |
| ·常见分词算法比较 | 第22-23页 |
| ·N-最短路径方法 | 第23-27页 |
| ·粗切分 | 第23-24页 |
| ·N-最短路径 | 第24-27页 |
| 第三章 中文垃圾邮件过滤系统中的特征项选择 | 第27-36页 |
| ·文本的表示 | 第27页 |
| ·向量空间模型 | 第27-28页 |
| ·常见的中文特征项选择 | 第28-31页 |
| ·特征表示 | 第28-29页 |
| ·特征提取 | 第29-31页 |
| ·基于粗集约简的特征提取 | 第31-36页 |
| ·粗糙集(Rough Set)理论 | 第31-33页 |
| ·约简粗集的特征选取 | 第33-36页 |
| 第四章 中文垃圾邮件过滤系统模拟及分析 | 第36-53页 |
| ·现有的基于文本挖掘的邮件分类技术 | 第36页 |
| ·邮件自身的特点 | 第36页 |
| ·贝叶斯分类技术 | 第36-39页 |
| ·贝叶斯定理(Bayes) | 第36-37页 |
| ·朴素贝叶斯分类(Naive Bayes) | 第37-38页 |
| ·贝叶斯信念网络 | 第38页 |
| ·树状贝叶斯网络(Tree Angmented Naive Bayes) | 第38-39页 |
| ·基于粗集属性约简的贝叶斯中文邮件分类的系统设计 | 第39-47页 |
| ·总体设计思想 | 第39-40页 |
| ·邮件预处理 | 第40-43页 |
| ·特征项选取 | 第43-45页 |
| ·基于依赖性的属性约简的贝叶斯邮件分类技术 | 第45-47页 |
| ·模拟和分析 | 第47-48页 |
| ·实例分析的重要性 | 第47页 |
| ·评估方法 | 第47-48页 |
| ·模拟系统的构建 | 第48-53页 |
| ·系统需要的数据准备 | 第48-49页 |
| ·测试所需环境 | 第49页 |
| ·实验结果 | 第49-52页 |
| ·实验总结 | 第52-53页 |
| 第五章 总结与展望 | 第53-55页 |
| ·总结 | 第53页 |
| ·创新与不足 | 第53页 |
| ·展望 | 第53-55页 |
| 参考文献 | 第55-57页 |
| 攻读硕士学位期间发表的论文 | 第57页 |