基于LSA和MD5算法的垃圾邮件过滤系统研究
| 摘要 | 第1-8页 |
| Abstract | 第8-9页 |
| 插图索引 | 第9-10页 |
| 附表索引 | 第10-11页 |
| 第1章 绪论 | 第11-20页 |
| ·研究的背景及意义 | 第11页 |
| ·研究现状及面临的挑战 | 第11-18页 |
| ·反垃圾邮件技术 | 第11-13页 |
| ·目前垃圾邮件的过滤方式 | 第13-15页 |
| ·目前垃圾邮件过滤的主要方法 | 第15-16页 |
| ·垃圾邮件反过滤的新方法 | 第16-18页 |
| ·面临的挑战 | 第18页 |
| ·论文主要研究内容、创新工作及组织结构安排 | 第18-20页 |
| 第2章 电子邮件系统工作原理 | 第20-29页 |
| ·邮件传送过程 | 第20-21页 |
| ·电子邮件系统的组成与工作模式 | 第21页 |
| ·几个重要协议和编码标准 | 第21-28页 |
| ·TCP/IP | 第22-24页 |
| ·SMTP | 第24-25页 |
| ·POP3/IMAP | 第25-27页 |
| ·电子邮件的三种编码标准 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第3章 潜在语义分析的邮件过滤技术研究 | 第29-38页 |
| ·潜在语义分析法(LSA)概述 | 第29-32页 |
| ·理想的潜在语义分析模型 | 第29页 |
| ·潜在语义分析的基本原理 | 第29-32页 |
| ·奇异值分解(SVD) | 第32-35页 |
| ·奇异值分解理论 | 第32-34页 |
| ·奇异值分解在潜在语义分析法中的运用 | 第34-35页 |
| ·扩展的潜在语义分析技术(USA) | 第35-36页 |
| ·变形特征词(词组)识别历史矢量更新技术 | 第35-36页 |
| ·变形特征词(词组)的预测置信度 | 第36页 |
| ·试验结果与分析 | 第36-37页 |
| ·本章小结 | 第37-38页 |
| 第4章 LSA和MD5算法的垃圾邮件过滤系统研究 | 第38-49页 |
| ·相似文本检测技术概述 | 第38-39页 |
| ·信息—摘要算法 | 第39-43页 |
| ·MD5 | 第39-41页 |
| ·SHA | 第41-43页 |
| ·SHA和MD5的比较 | 第43页 |
| ·垃圾邮件过滤系统采用的软硬件环境 | 第43页 |
| ·硬件环境 | 第43页 |
| ·软件环境 | 第43页 |
| ·垃圾邮件过滤系统的总体结构 | 第43-44页 |
| ·系统各个主要模块功能 | 第44-46页 |
| ·预处理模块 | 第44页 |
| ·LSA特征提取模块 | 第44-45页 |
| ·特征码生成模块 | 第45页 |
| ·"邮件指纹"库模块 | 第45-46页 |
| ·系统实验结果分析 | 第46-48页 |
| ·本章小结 | 第48-49页 |
| 总结与展望 | 第49-51页 |
| 参考文献 | 第51-56页 |
| 致谢 | 第56-57页 |
| 附录A 攻读硕士学位期间所发表的学术论文 | 第57页 |