摘要 | 第1-5页 |
Abstract | 第5-6页 |
目录 | 第6-9页 |
第一章 引言 | 第9-12页 |
·背景 | 第9-10页 |
·项目目标 | 第10页 |
·论文概要 | 第10-12页 |
第二章 理论基础 | 第12-20页 |
·邮件过滤的现有方法 | 第12-13页 |
·文本分类 | 第13-18页 |
·文本分类的种类 | 第13-14页 |
·Single-lable vs. Multi-lable | 第13页 |
·Category-pivoted vs. Document-pivoted | 第13-14页 |
·Hard-decision vs. Ranking | 第14页 |
·文本机器学习 | 第14-18页 |
·基本学习途径 | 第14-15页 |
·训练集和测试集 | 第15页 |
·特征选择 | 第15-16页 |
·有效性评估 | 第16-18页 |
·基于学习的方法 | 第18-20页 |
·Nalve Bayes | 第18页 |
·Support Vector Machines | 第18-19页 |
·Boosting Trees | 第19页 |
·Chi-Square | 第19-20页 |
第三章 LVQ 邮件过滤模型的设计 | 第20-35页 |
·数据预处理 | 第20-24页 |
·性能测试集的选择 | 第20页 |
·分词处理 | 第20-21页 |
·英文分词 | 第21页 |
·中文分词 | 第21页 |
·邮件的表示 | 第21-23页 |
·特征项的提取 | 第23-24页 |
·LVQ 邮件过滤模型 | 第24-35页 |
·垃圾邮件的定义与分类 | 第24-25页 |
·布尔型垃圾邮件过滤模型的弊端 | 第25-26页 |
·学习矢量量化(LVQ)邮件过滤模型 | 第26-29页 |
·模型推理 | 第26-28页 |
·模型构架 | 第28-29页 |
·LVQ 邮件过滤模型训练算法LVQTrn | 第29-32页 |
·LVQTrn 算法 | 第29-31页 |
·初始化聚类中心 | 第31页 |
·相似度的计算 | 第31页 |
·学习率选择 | 第31-32页 |
·终止条件 | 第32页 |
·LVQ 邮件过滤模型过滤算法LVQFlt | 第32-35页 |
·LVQFlt 算法 | 第32-34页 |
·胜者全得竞争 | 第34页 |
·规约计算 | 第34页 |
·邮件类型常量标识 | 第34-35页 |
第四章 反垃圾邮件LVQ 网络 | 第35-54页 |
·参数取值 | 第35-36页 |
·网络框架 | 第36-37页 |
·程序实现 | 第37-54页 |
·预处理模块 | 第37-44页 |
·单词的存储结构 | 第37-39页 |
·主流程 | 第39-40页 |
·子类单词信息的统计 | 第40-42页 |
·训练集单词信息的统计 | 第42-44页 |
·特征向量的提取 | 第44页 |
·训练模块 | 第44-49页 |
·主流程 | 第44-46页 |
·权值向量的计算 | 第46-47页 |
·子类竞争 | 第47-48页 |
·聚类中心的调整 | 第48-49页 |
·测试模块 | 第49-52页 |
·主流程 | 第49-50页 |
·过滤流程 | 第50-51页 |
·规约 | 第51-52页 |
·评估模块 | 第52-54页 |
第五章 反垃圾邮件LVQ 网络性能分析 | 第54-68页 |
·评估标准 | 第54-56页 |
·性能评估 | 第56-64页 |
·基本性能 | 第57-58页 |
·低严格度λ=1 | 第58-59页 |
·中严格度λ=9 | 第59-60页 |
·高严格度λ=999 | 第60页 |
·综合评估 | 第60-64页 |
·与其他方法的比较 | 第64-68页 |
·低严格度λ=1 | 第65-66页 |
·中严格度λ=9 | 第66页 |
·高严格度λ=999 | 第66-67页 |
·综合评估 | 第67-68页 |
第六章 改进型BW 邮件过滤模型的设计与实现 | 第68-71页 |
·设计原理 | 第68-69页 |
·BW-LVQ 邮件过滤模型 | 第69-70页 |
·实现 | 第70-71页 |
第七章 基于BW-LVQ 邮件过滤模型的邮件服务器 | 第71-75页 |
·邮件服务器过滤模块接口 | 第71-73页 |
·SMTP 服务器 | 第71页 |
·过滤模块插入接口 | 第71-73页 |
·LVQ 邮件过滤模块的插入点 | 第73页 |
·过滤延迟 | 第73页 |
·插入点的选择 | 第73页 |
·BW 邮件过滤模块的插入点 | 第73-75页 |
·过滤延迟 | 第73-74页 |
·插入点的选择 | 第74-75页 |
第八章 性能优化讨论 | 第75-78页 |
·LVQ 邮件过滤模型 | 第75-76页 |
·个性化训练 | 第75-76页 |
·发送者确认机制 | 第76页 |
·BW 邮件过滤模型 | 第76-78页 |
·反馈BW 名单机制 | 第77-78页 |
第九章 结论 | 第78-79页 |
参考文献 | 第79-82页 |
致谢 | 第82-83页 |
个人简历 | 第83页 |