基于文本处理技术的中文电子邮件分类系统的设计与实现

摘要	第1-5页
ABSTRACT	第5-11页
第一章引言	第11-17页
·文本分类技术的发展历程与研究现状	第11-13页
·文本分类概述	第11-12页
·文本自动分类问题的一般性描述	第12-13页
·基于文本分类技术的电子邮件分类	第13-16页
·任务背景	第13页
·垃圾邮件定义	第13页
·常用反垃圾邮件技术	第13-15页
·电子邮件分类技术	第15-16页
·本文研究的内容及章节分布	第16-17页
第二章电子邮件分类预处理技术	第17-25页
·基于文本分类技术的电子邮件分类基本模型	第17-18页
·中文分词技术	第18-20页
·基于字符串匹配的分词方法	第18-19页
·基于理解的分词方法	第19页
·基于统计的分词方法	第19页
·计算所汉语词法分析系统ICTCLAS	第19-20页
·特征表示方法	第20-22页
·特征提取技术	第22-25页
第三章基于VSM 的文本分类的模型和主要算法	第25-31页
·经典文本分类模型	第25-30页
·度量方法	第25-29页
·非度量方法	第29-30页
·各种算法在电子邮件分类中的比较	第30页
·小结	第30-31页
第四章使用改进的简单向量距离分类算法的电子邮件分类系统设计	第31-42页
·系统任务	第31页
·系统的总体框架结构	第31-32页
·分类前的电子邮件处理	第32-37页
·邮件解码器设计	第32-36页
·中文分词器设计	第36-37页
·特征项的表示及提取	第37-38页
·分类算法	第38-40页
·改进的简单向量距离分类法	第38-39页
·阀值的确定	第39-40页
·文本分类的评估方法	第40-41页
·小结	第41-42页
第五章电子邮件分类实现方案	第42-63页
·电子邮件分类系统工作流程	第42-43页
·邮件解码器的实现	第43-47页
·解码流程	第43-44页
·邮件头Field 结构	第44-45页
·邮件解码算法	第45-47页
·邮件中文分词	第47-48页
·特征提取模块	第48-53页
·数据准备过程	第48-51页
·特征提取的实现	第51-53页
·分类器训练	第53-56页
·邮件向量表示模块	第53-54页
·各词中心权值表示模块	第54-55页
·阀值确定模块	第55-56页
·分类器的实现	第56-60页
·待分类邮件向量表示的实现	第56-58页
·改进的简单向量距离算法的实现	第58-60页
·实验数据分析	第60-62页
·分类测试结果分析	第60-61页
·本系统实验结果评估	第61-62页
·小结	第62-63页
第六章结束语	第63-65页
·本人所作的主要工作及贡献	第63页
·下一步的工作	第63-65页
参考文献	第65-68页
致谢	第68-69页
在学期间的研究成果及发表的学术论文	第69页