| 摘要 | 第1-5页 |
| Abstract | 第5-6页 |
| 目录 | 第6-9页 |
| 第一章 引言 | 第9-12页 |
| ·背景 | 第9-10页 |
| ·项目目标 | 第10页 |
| ·论文概要 | 第10-12页 |
| 第二章 理论基础 | 第12-20页 |
| ·邮件过滤的现有方法 | 第12-13页 |
| ·文本分类 | 第13-18页 |
| ·文本分类的种类 | 第13-14页 |
| ·Single-lable vs. Multi-lable | 第13页 |
| ·Category-pivoted vs. Document-pivoted | 第13-14页 |
| ·Hard-decision vs. Ranking | 第14页 |
| ·文本机器学习 | 第14-18页 |
| ·基本学习途径 | 第14-15页 |
| ·训练集和测试集 | 第15页 |
| ·特征选择 | 第15-16页 |
| ·有效性评估 | 第16-18页 |
| ·基于学习的方法 | 第18-20页 |
| ·Nalve Bayes | 第18页 |
| ·Support Vector Machines | 第18-19页 |
| ·Boosting Trees | 第19页 |
| ·Chi-Square | 第19-20页 |
| 第三章 LVQ 邮件过滤模型的设计 | 第20-35页 |
| ·数据预处理 | 第20-24页 |
| ·性能测试集的选择 | 第20页 |
| ·分词处理 | 第20-21页 |
| ·英文分词 | 第21页 |
| ·中文分词 | 第21页 |
| ·邮件的表示 | 第21-23页 |
| ·特征项的提取 | 第23-24页 |
| ·LVQ 邮件过滤模型 | 第24-35页 |
| ·垃圾邮件的定义与分类 | 第24-25页 |
| ·布尔型垃圾邮件过滤模型的弊端 | 第25-26页 |
| ·学习矢量量化(LVQ)邮件过滤模型 | 第26-29页 |
| ·模型推理 | 第26-28页 |
| ·模型构架 | 第28-29页 |
| ·LVQ 邮件过滤模型训练算法LVQTrn | 第29-32页 |
| ·LVQTrn 算法 | 第29-31页 |
| ·初始化聚类中心 | 第31页 |
| ·相似度的计算 | 第31页 |
| ·学习率选择 | 第31-32页 |
| ·终止条件 | 第32页 |
| ·LVQ 邮件过滤模型过滤算法LVQFlt | 第32-35页 |
| ·LVQFlt 算法 | 第32-34页 |
| ·胜者全得竞争 | 第34页 |
| ·规约计算 | 第34页 |
| ·邮件类型常量标识 | 第34-35页 |
| 第四章 反垃圾邮件LVQ 网络 | 第35-54页 |
| ·参数取值 | 第35-36页 |
| ·网络框架 | 第36-37页 |
| ·程序实现 | 第37-54页 |
| ·预处理模块 | 第37-44页 |
| ·单词的存储结构 | 第37-39页 |
| ·主流程 | 第39-40页 |
| ·子类单词信息的统计 | 第40-42页 |
| ·训练集单词信息的统计 | 第42-44页 |
| ·特征向量的提取 | 第44页 |
| ·训练模块 | 第44-49页 |
| ·主流程 | 第44-46页 |
| ·权值向量的计算 | 第46-47页 |
| ·子类竞争 | 第47-48页 |
| ·聚类中心的调整 | 第48-49页 |
| ·测试模块 | 第49-52页 |
| ·主流程 | 第49-50页 |
| ·过滤流程 | 第50-51页 |
| ·规约 | 第51-52页 |
| ·评估模块 | 第52-54页 |
| 第五章 反垃圾邮件LVQ 网络性能分析 | 第54-68页 |
| ·评估标准 | 第54-56页 |
| ·性能评估 | 第56-64页 |
| ·基本性能 | 第57-58页 |
| ·低严格度λ=1 | 第58-59页 |
| ·中严格度λ=9 | 第59-60页 |
| ·高严格度λ=999 | 第60页 |
| ·综合评估 | 第60-64页 |
| ·与其他方法的比较 | 第64-68页 |
| ·低严格度λ=1 | 第65-66页 |
| ·中严格度λ=9 | 第66页 |
| ·高严格度λ=999 | 第66-67页 |
| ·综合评估 | 第67-68页 |
| 第六章 改进型BW 邮件过滤模型的设计与实现 | 第68-71页 |
| ·设计原理 | 第68-69页 |
| ·BW-LVQ 邮件过滤模型 | 第69-70页 |
| ·实现 | 第70-71页 |
| 第七章 基于BW-LVQ 邮件过滤模型的邮件服务器 | 第71-75页 |
| ·邮件服务器过滤模块接口 | 第71-73页 |
| ·SMTP 服务器 | 第71页 |
| ·过滤模块插入接口 | 第71-73页 |
| ·LVQ 邮件过滤模块的插入点 | 第73页 |
| ·过滤延迟 | 第73页 |
| ·插入点的选择 | 第73页 |
| ·BW 邮件过滤模块的插入点 | 第73-75页 |
| ·过滤延迟 | 第73-74页 |
| ·插入点的选择 | 第74-75页 |
| 第八章 性能优化讨论 | 第75-78页 |
| ·LVQ 邮件过滤模型 | 第75-76页 |
| ·个性化训练 | 第75-76页 |
| ·发送者确认机制 | 第76页 |
| ·BW 邮件过滤模型 | 第76-78页 |
| ·反馈BW 名单机制 | 第77-78页 |
| 第九章 结论 | 第78-79页 |
| 参考文献 | 第79-82页 |
| 致谢 | 第82-83页 |
| 个人简历 | 第83页 |