首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于后缀树模型的流文本表示研究及其应用

声 明第1页
关于论文使用授权的说明第2-3页
摘要第3-4页
Abstract第4-11页
第1章 引言第11-15页
   ·问题的提出第11-12页
   ·应用背景第12-13页
   ·内容安排第13-15页
第2章 研究现状第15-29页
   ·概述第15-16页
   ·文档存储的数据结构第16-21页
     ·队列第16-18页
     ·AVL树第18页
     ·B树第18-19页
     ·散列表第19-20页
     ·T树第20-21页
   ·特征项粒度的选择方法第21-22页
   ·特征项筛选方法第22-26页
     ·类别可分离性判据第23-25页
     ·特征选择方法第25-26页
   ·特征项权重计算第26-27页
   ·相似度计算第27-29页
第3章 基于后缀树模型的流文本表示第29-41页
   ·概述第29页
   ·后缀树模型(STM)第29-35页
     ·STM相关理论第29-32页
     ·STM相关算法第32-35页
     ·STM复杂度分析第35页
   ·后缀树模型的改进第35-38页
     ·通用后缀树模型(GSTM)第35-37页
     ·n-截枝后缀树模型第37-38页
   ·向量化算法第38页
   ·权重计算算法第38-39页
   ·相似度计算算法第39-41页
第4章 基于后缀树模型的垃圾邮件过滤第41-55页
   ·概述第41-43页
     ·垃圾邮件的定义第41-42页
     ·垃圾邮件过滤与文本分类第42-43页
   ·垃圾邮件过滤方法第43-47页
     ·服务器端和客户端的邮件过滤第43-44页
     ·白名单和黑名单第44-45页
     ·设定过滤规则第45-46页
     ·基于内容的垃圾邮件过滤技术第46-47页
   ·内容过滤中的分类算法第47-50页
     ·近邻分类算法第47-48页
     ·中心向量分类算法第48-49页
     ·朴素贝叶斯分类算法第49页
     ·基于聚类粒度的分类算法第49-50页
   ·邮件过滤系统实现第50-55页
     ·Spam Assassin概述第50-52页
     ·Spam Assassin的设置第52-53页
     ·基于STM的垃圾邮件过滤部分第53-55页
第5章 实验结果及分析第55-67页
   ·文本分类实验第55-58页
     ·实验说明第55页
     ·评价标准第55-56页
     ·实验语料第56页
     ·正确率结果与分析第56-58页
   ·垃圾邮件过滤实验第58-66页
     ·评价标准第58页
     ·实验语料第58-61页
     ·实验结果与分析第61-65页
     ·复杂度比较分析第65-66页
   ·实验总结第66-67页
第6章 总结与展望第67-69页
   ·总结第67-68页
   ·展望第68-69页
参考文献第69-75页
致谢第75-77页
作者简历第77页

论文共77页,点击 下载论文
上一篇:稻瘟菌REMI突变体库的构建和突变体筛选
下一篇:几种园艺植物病毒的分子鉴定与序列分析