基于最大熵模型的垃圾邮件过滤系统研究
中文摘要 | 第1-5页 |
Abstract | 第5-11页 |
第一章 引言 | 第11-22页 |
·概述 | 第11-14页 |
·垃圾邮件的定义 | 第11页 |
·垃圾邮件的危害 | 第11-12页 |
·反垃圾邮件的主要措施 | 第12-13页 |
·反垃圾邮件技术发展 | 第13-14页 |
·电子邮件的工作原理 | 第14-20页 |
·邮件的格式 | 第14页 |
·邮件传输过程 | 第14-15页 |
·邮件系统相关的协议和标准 | 第15-20页 |
·课题的工作与意义 | 第20页 |
·本文的内容安排 | 第20-21页 |
·本章小结 | 第21-22页 |
第二章 垃圾邮件过滤技术研究的现状 | 第22-34页 |
·垃圾邮件过滤的位置 | 第22-23页 |
·基于IP 地址的垃圾邮件过滤 | 第23页 |
·基于邮件头的垃圾邮件过滤 | 第23-24页 |
·基于内容的垃圾邮件过滤 | 第24-32页 |
·垃圾邮件过滤与文本分类 | 第24-25页 |
·垃圾邮件过滤与文本过滤 | 第25-26页 |
·过滤性能评价体系 | 第26-27页 |
·基于规则的过滤方法 | 第27-29页 |
·基于统计的过滤方法 | 第29-31页 |
·常用算法的对比实验 | 第31-32页 |
·其它过滤方法 | 第32-33页 |
·本章小结 | 第33-34页 |
第三章 邮件预处理 | 第34-43页 |
·邮件解码 | 第34-35页 |
·邮件内容分解 | 第34页 |
·邮件内容解码 | 第34-35页 |
·邮件内容分词处理 | 第35页 |
·邮件内容预处理 | 第35-37页 |
·HTML 标记处理 | 第35-36页 |
·邮件字符集转换 | 第36页 |
·特殊字符转换 | 第36-37页 |
·去停用词 | 第37页 |
·邮件的XML 表示 | 第37-42页 |
·邮件头的表示 | 第38-39页 |
·邮件正文的表示 | 第39-42页 |
·本章小结 | 第42-43页 |
第四章 最大熵模型在垃圾邮件过滤中的应用 | 第43-70页 |
·最大熵模型 | 第43-48页 |
·基本思想 | 第43-44页 |
·最大熵模型框架 | 第44页 |
·特征函数与约束方程 | 第44-46页 |
·最大熵模型的参数形式 | 第46-48页 |
·模型选择算法 | 第48-50页 |
·GIS 算法 | 第48-49页 |
·IIS 算法 | 第49-50页 |
·特征选择算法 | 第50-52页 |
·基于频度阈值的特征选择 | 第50页 |
·增量式特征选择 | 第50-52页 |
·基于最大熵的垃圾邮件过滤系统框架 | 第52-54页 |
·邮件特征提取 | 第54-62页 |
·邮件的结构特征与文本特征 | 第54-55页 |
·邮件特征函数定义 | 第55-56页 |
·实验结果分析 | 第56-62页 |
·邮件特征平滑 | 第62-64页 |
·绝对折扣平滑 | 第62-63页 |
·高斯先验平滑 | 第63页 |
·实验结果分析 | 第63-64页 |
·模型自适应学习 | 第64-67页 |
·增量式学习 | 第65页 |
·重新学习 | 第65页 |
·垃圾邮件过滤模型的自适应调整 | 第65-66页 |
·实验结果分析 | 第66-67页 |
·最大熵方法与其它常用过滤算法的比较 | 第67-69页 |
·本章小结 | 第69-70页 |
第五章 基于最大熵的垃圾邮件过滤插件的设计与开发 | 第70-79页 |
·Outlook 插件开发技术分析 | 第70-72页 |
·互操作程序集 | 第70-71页 |
·Outlook 2003 的对象模型 | 第71-72页 |
·用.NET 开发Outlook 2003 插件 | 第72-75页 |
·IDTExtensibility2 接口的角色 | 第72-74页 |
·实现用户界面和业务逻辑 | 第74页 |
·注册共享外接程序 | 第74-75页 |
·基于最大熵的垃圾邮件过滤插件的设计与开发 | 第75-78页 |
·系统结构 | 第75页 |
·实现技术 | 第75-78页 |
·实验结果分析 | 第78页 |
·本章小结 | 第78-79页 |
第六章 总结与展望 | 第79-81页 |
·本文总结 | 第79-80页 |
·未来工作 | 第80-81页 |
参考文献 | 第81-86页 |
攻读学位期间公开发表的论文 | 第86-87页 |
致谢 | 第87-88页 |
中文详细摘要 | 第88-90页 |