首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

带噪声的文本聚类及其在反垃圾邮件中的应用

摘要第1-5页
ABSTRACT第5-7页
目录第7-10页
CONTENTS第10-13页
第一章 绪论第13-19页
   ·本文选题背景及研究意义第13-15页
   ·文本聚类需要解决的几个问题第15-17页
     ·文本的表示第15-16页
     ·特征降维第16页
     ·文本相似度计算第16-17页
     ·聚类算法的选择第17页
   ·本文的主要内容及创新点第17-19页
第二章 文本聚类算法及相关问题第19-31页
   ·相似度的定义第19-20页
   ·中文文本相似度的研究现状第20-21页
     ·中文与西文的区别第20页
     ·文本相似度研究方法第20-21页
   ·中文相似度计算方法第21-24页
     ·向量空间模型第21-22页
     ·隐性语义索引第22-23页
     ·基于汉明距离的文本相似度第23-24页
     ·基于语义理解的相似度第24页
   ·主要的聚类算法第24-26页
     ·划分方法第24-25页
     ·层次方法第25页
     ·基于密度的方法第25-26页
     ·基于网格的方法第26页
     ·基于模型的方法第26页
   ·聚类方法的研究进展第26-27页
   ·聚类质量的评价第27-30页
     ·纯度第27页
     ·熵第27-28页
     ·归一化信息第28页
     ·特征测量第28-29页
     ·平均准确率第29-30页
   ·本章小结第30-31页
第三章 基于Needleman-Wunsch的聚类算法第31-38页
   ·序列比对第31-32页
     ·整体比对第32页
     ·局部比对第32页
   ·Needleman-Wunsch算法第32-34页
     ·图解表示第33-34页
     ·形式化描述第34页
   ·文档相似度计算第34-35页
   ·基于Needleman-Wunsch的聚类算法第35-36页
   ·算法流程图第36页
   ·算法分析第36-37页
   ·本章小结第37-38页
第四章 Needleman-Wunsch聚类在垃圾邮件归类中的应用第38-43页
   ·垃圾邮件的特点第38页
   ·数据集描述第38-39页
   ·对比方法介绍第39-41页
     ·传统的向量空间模型第39-40页
     ·基于《知网》的聚类算法第40页
     ·基于《知网》的Needleman-Wunsch算法第40-41页
   ·参数设置第41页
   ·实验结果及分析第41-42页
   ·本章小结第42-43页
第五章 结合Needleman-Wunsch聚类算法的反垃圾邮件系统的设计第43-47页
   ·电子邮件交换原理第43-44页
   ·黑白名单第44页
     ·黑名单第44页
     ·白名单第44页
   ·基于内容的过滤技术第44-45页
   ·系统总框架第45-46页
   ·本章小结第46-47页
结论第47-48页
参考文献第48-52页
攻读学位期间发表的论文第52-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:基于遗传算法的区域交通网络最短路径算法研究
下一篇:网络安全态势评估技术的研究与实现