基于后缀树模型的流文本表示研究及其应用

声明	第1页
关于论文使用授权的说明	第2-3页
摘要	第3-4页
Abstract	第4-11页
第1章引言	第11-15页
·问题的提出	第11-12页
·应用背景	第12-13页
·内容安排	第13-15页
第2章研究现状	第15-29页
·概述	第15-16页
·文档存储的数据结构	第16-21页
·队列	第16-18页
·AVL树	第18页
·B树	第18-19页
·散列表	第19-20页
·T树	第20-21页
·特征项粒度的选择方法	第21-22页
·特征项筛选方法	第22-26页
·类别可分离性判据	第23-25页
·特征选择方法	第25-26页
·特征项权重计算	第26-27页
·相似度计算	第27-29页
第3章基于后缀树模型的流文本表示	第29-41页
·概述	第29页
·后缀树模型(STM)	第29-35页
·STM相关理论	第29-32页
·STM相关算法	第32-35页
·STM复杂度分析	第35页
·后缀树模型的改进	第35-38页
·通用后缀树模型（GSTM）	第35-37页
·n-截枝后缀树模型	第37-38页
·向量化算法	第38页
·权重计算算法	第38-39页
·相似度计算算法	第39-41页
第4章基于后缀树模型的垃圾邮件过滤	第41-55页
·概述	第41-43页
·垃圾邮件的定义	第41-42页
·垃圾邮件过滤与文本分类	第42-43页
·垃圾邮件过滤方法	第43-47页
·服务器端和客户端的邮件过滤	第43-44页
·白名单和黑名单	第44-45页
·设定过滤规则	第45-46页
·基于内容的垃圾邮件过滤技术	第46-47页
·内容过滤中的分类算法	第47-50页
·近邻分类算法	第47-48页
·中心向量分类算法	第48-49页
·朴素贝叶斯分类算法	第49页
·基于聚类粒度的分类算法	第49-50页
·邮件过滤系统实现	第50-55页
·Spam Assassin概述	第50-52页
·Spam Assassin的设置	第52-53页
·基于STM的垃圾邮件过滤部分	第53-55页
第5章实验结果及分析	第55-67页
·文本分类实验	第55-58页
·实验说明	第55页
·评价标准	第55-56页
·实验语料	第56页
·正确率结果与分析	第56-58页
·垃圾邮件过滤实验	第58-66页
·评价标准	第58页
·实验语料	第58-61页
·实验结果与分析	第61-65页
·复杂度比较分析	第65-66页
·实验总结	第66-67页
第6章总结与展望	第67-69页
·总结	第67-68页
·展望	第68-69页
参考文献	第69-75页
致谢	第75-77页
作者简历	第77页