首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于聚类的半监督中文垃圾邮件过滤研究与实现

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-16页
   ·引言第10-12页
     ·课题研究背景第10-11页
     ·近期垃圾邮件状况第11-12页
   ·国内外研究现状第12-14页
     ·黑白名单技术第12-13页
     ·关键词过滤第13页
     ·基于规则的过滤第13页
     ·机器学习方法第13-14页
   ·本文的主要工作第14-15页
   ·论文的内容安排第15-16页
第二章 邮件过滤的关键技术及评价指标第16-25页
   ·电子邮件报文格式第16-17页
   ·MIME 邮件内容解析第17页
   ·中文分词第17-18页
     ·汉语词法分析系统 ICTCLAS第17-18页
     ·去除停用词第18页
   ·向量空间模型第18-19页
   ·贝叶斯定理第19-20页
     ·贝叶斯定理介绍第19页
     ·朴素贝叶斯的原理第19-20页
   ·支持向量机基本思想第20-22页
     ·最优分类平面第20-21页
     ·结构风险最小化第21页
     ·内积核函数第21-22页
   ·邮件过滤测评相关技术第22-24页
     ·邮件过滤模式第22-23页
     ·过滤器评价体系第23-24页
     ·参照标准第24页
     ·评测数据集第24页
   ·本章小结第24-25页
第三章 基于聚类的邮件过滤模型第25-38页
   ·传统邮件过滤模型第25-26页
   ·基于聚类的邮件过滤模型第26-28页
   ·聚类前邮件预处理第28-30页
     ·邮件解码第29页
     ·提取邮件特征第29-30页
     ·向量表示第30页
   ·聚类算法第30-31页
     ·划分聚类方法第30-31页
     ·层次聚类方法第31页
   ·聚类类别数 k 的确定第31-33页
     ·聚类类别数 K 的选择第31页
     ·邮件聚类效果评价方法第31-32页
     ·聚类类别数 K 的实验说明第32-33页
   ·聚类效果评价第33-37页
     ·实验流程说明第33-35页
     ·实验结果及分析第35-37页
   ·本章小结第37-38页
第四章 邮件类属性判别方法第38-46页
   ·相似度计算方法第38-41页
     ·基于向量空间的文本相似度计算方法第38-39页
     ·基于汉明距离的文本相似度计算方法第39-40页
     ·其它文本相似度计算方法第40-41页
   ·邮件类属性判别的计算方法第41-42页
     ·基于向量空间的邮件类属性判别方法第41-42页
     ·基于汉明距离的邮件类属性判别方法第42页
   ·实验及结果分析第42-45页
   ·本章小结第45-46页
第五章 邮件过滤半监督学习方法第46-51页
   ·半监督学习方法第46-48页
     ·半监督学习方法的思想第46-47页
     ·半监督学习算法第47页
     ·半监督算法在邮件过滤应用上的效果评价第47-48页
   ·基于聚类的邮件过滤模型的半监督学习方法第48-49页
     ·基于聚类的半监督学习方法思想第48-49页
     ·基于聚类的邮件过滤模型半监督学习方法第49页
   ·实验及结果分析第49-50页
   ·本章小结第50-51页
第六章 集成实验及结果分析第51-54页
   ·过滤器设计第51页
   ·实验及性能分析第51-53页
     ·离线过滤模式下的性能比较第52页
     ·在线过滤模式下的性能比较第52-53页
   ·本章小结第53-54页
结论及展望第54-55页
参考文献第55-58页
攻读硕士学位期间取得的研究成果第58-59页
致谢第59-60页
附件第60页

论文共60页,点击 下载论文
上一篇:基于L-GEM和样本不平衡的视频字幕提取方法
下一篇:医疗健康服务平台的设计与实现