首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义体与文本聚类的中文垃圾邮件过滤方法研究

摘要第1-9页
Abstract第9-11页
插图索引第11-12页
附表索引第12-13页
第1章 绪论第13-23页
   ·课题的研究背景与意义第13-16页
     ·垃圾邮件的危害第13-14页
     ·中国网民垃圾邮件的现状第14-16页
     ·课题的研究意义第16页
   ·国内外研究现状第16-20页
     ·垃圾邮件过滤技术的研究现状第16-18页
     ·语义相似度的研究现状第18-19页
     ·文本聚类的研究现状第19-20页
   ·当前垃圾邮件过滤技术面临的挑战第20-21页
   ·论文的主要研究内容第21页
   ·论文的组织结构与安排第21-23页
第2章 垃圾邮件过滤技术第23-37页
   ·基于内容的垃圾邮件过滤的关键步骤第23-30页
     ·邮件预处理第23-25页
     ·特征选择第25-26页
     ·文本表示第26-28页
     ·垃圾邮件过滤中常用的分类算法第28-29页
     ·垃圾邮件过滤的评价体系第29-30页
   ·语义体的相关技术发展第30-32页
     ·《知网》简介第30-31页
     ·基于《知网》的语义相似度第31-32页
     ·词汇链第32页
   ·文本聚类的相关技术发展第32-36页
     ·传统的文本聚类算法第33-34页
     ·基于语义距离的文本聚类算法第34-36页
   ·本章小结第36-37页
第3章 基于语义体的垃圾邮件特征提取方法研究第37-42页
   ·新型中文文本垃圾邮件特征第37-38页
   ·语义体的定义第38页
   ·语义体构建的核心步骤第38-40页
     ·词义消歧第38-39页
     ·词汇链处理第39-40页
     ·TFIDF 方法第40页
   ·基于语义体的邮件特征提取方法第40-41页
   ·本章小结第41-42页
第4章 基于语义体与文本聚类的中文垃圾邮件过滤方法第42-47页
   ·基于语义距离的文本聚类算法第42-44页
     ·基于《知网》的语义距离计算第42-43页
     ·文本相似度度量第43-44页
     ·类特征更新第44页
   ·基于语义距离的邮件文本聚类方法第44-46页
     ·第一次邮件文本聚类第45页
     ·整理第一次聚类结果第45页
     ·第二次邮件文本聚类第45-46页
     ·垃圾邮件过滤第46页
   ·本章小结第46-47页
第5章 基于语义体和文本聚类的垃圾邮件过滤验证实例第47-55页
   ·测试平台及语料库第47页
     ·机器配置第47页
     ·实验语料库第47页
   ·评价体系第47页
   ·基于语义体与文本聚类的中文垃圾邮件过滤过程第47-54页
     ·垃圾邮件过滤实例验证第48-52页
     ·性能对比分析第52-54页
   ·本章小结第54-55页
总结与展望第55-57页
参考文献第57-64页
致谢第64-65页
附录A 攻读硕士学位期间所发表的学术论文第65页

论文共65页,点击 下载论文
上一篇:基于流形学习算法的人脸表情识别研究
下一篇:基于典型相关分析的人脸识别方法研究