首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于文本处理技术的中文电子邮件分类系统的设计与实现

摘要第1-5页
ABSTRACT第5-11页
第一章 引言第11-17页
   ·文本分类技术的发展历程与研究现状第11-13页
     ·文本分类概述第11-12页
     ·文本自动分类问题的一般性描述第12-13页
   ·基于文本分类技术的电子邮件分类第13-16页
     ·任务背景第13页
     ·垃圾邮件定义第13页
     ·常用反垃圾邮件技术第13-15页
     ·电子邮件分类技术第15-16页
   ·本文研究的内容及章节分布第16-17页
第二章 电子邮件分类预处理技术第17-25页
   ·基于文本分类技术的电子邮件分类基本模型第17-18页
   ·中文分词技术第18-20页
     ·基于字符串匹配的分词方法第18-19页
     ·基于理解的分词方法第19页
     ·基于统计的分词方法第19页
     ·计算所汉语词法分析系统ICTCLAS第19-20页
   ·特征表示方法第20-22页
   ·特征提取技术第22-25页
第三章 基于VSM 的文本分类的模型和主要算法第25-31页
   ·经典文本分类模型第25-30页
     ·度量方法第25-29页
     ·非度量方法第29-30页
   ·各种算法在电子邮件分类中的比较第30页
   ·小结第30-31页
第四章 使用改进的简单向量距离分类算法的电子邮件分类系统设计第31-42页
   ·系统任务第31页
   ·系统的总体框架结构第31-32页
   ·分类前的电子邮件处理第32-37页
     ·邮件解码器设计第32-36页
     ·中文分词器设计第36-37页
   ·特征项的表示及提取第37-38页
   ·分类算法第38-40页
     ·改进的简单向量距离分类法第38-39页
     ·阀值的确定第39-40页
   ·文本分类的评估方法第40-41页
   ·小结第41-42页
第五章 电子邮件分类实现方案第42-63页
   ·电子邮件分类系统工作流程第42-43页
   ·邮件解码器的实现第43-47页
     ·解码流程第43-44页
     ·邮件头Field 结构第44-45页
     ·邮件解码算法第45-47页
   ·邮件中文分词第47-48页
   ·特征提取模块第48-53页
     ·数据准备过程第48-51页
     ·特征提取的实现第51-53页
   ·分类器训练第53-56页
     ·邮件向量表示模块第53-54页
     ·各词中心权值表示模块第54-55页
     ·阀值确定模块第55-56页
   ·分类器的实现第56-60页
     ·待分类邮件向量表示的实现第56-58页
     ·改进的简单向量距离算法的实现第58-60页
   ·实验数据分析第60-62页
     ·分类测试结果分析第60-61页
     ·本系统实验结果评估第61-62页
   ·小结第62-63页
第六章 结束语第63-65页
   ·本人所作的主要工作及贡献第63页
   ·下一步的工作第63-65页
参考文献第65-68页
致谢第68-69页
在学期间的研究成果及发表的学术论文第69页

论文共69页,点击 下载论文
上一篇:方便营养米饭产业化生产中关键技术的研究
下一篇:基于零售业态演变规律的家电连锁企业发展战略研究