基于语义体与文本聚类的中文垃圾邮件过滤方法研究

摘要	第1-9页
Abstract	第9-11页
插图索引	第11-12页
附表索引	第12-13页
第1章绪论	第13-23页
·课题的研究背景与意义	第13-16页
·垃圾邮件的危害	第13-14页
·中国网民垃圾邮件的现状	第14-16页
·课题的研究意义	第16页
·国内外研究现状	第16-20页
·垃圾邮件过滤技术的研究现状	第16-18页
·语义相似度的研究现状	第18-19页
·文本聚类的研究现状	第19-20页
·当前垃圾邮件过滤技术面临的挑战	第20-21页
·论文的主要研究内容	第21页
·论文的组织结构与安排	第21-23页
第2章垃圾邮件过滤技术	第23-37页
·基于内容的垃圾邮件过滤的关键步骤	第23-30页
·邮件预处理	第23-25页
·特征选择	第25-26页
·文本表示	第26-28页
·垃圾邮件过滤中常用的分类算法	第28-29页
·垃圾邮件过滤的评价体系	第29-30页
·语义体的相关技术发展	第30-32页
·《知网》简介	第30-31页
·基于《知网》的语义相似度	第31-32页
·词汇链	第32页
·文本聚类的相关技术发展	第32-36页
·传统的文本聚类算法	第33-34页
·基于语义距离的文本聚类算法	第34-36页
·本章小结	第36-37页
第3章基于语义体的垃圾邮件特征提取方法研究	第37-42页
·新型中文文本垃圾邮件特征	第37-38页
·语义体的定义	第38页
·语义体构建的核心步骤	第38-40页
·词义消歧	第38-39页
·词汇链处理	第39-40页
·TFIDF 方法	第40页
·基于语义体的邮件特征提取方法	第40-41页
·本章小结	第41-42页
第4章基于语义体与文本聚类的中文垃圾邮件过滤方法	第42-47页
·基于语义距离的文本聚类算法	第42-44页
·基于《知网》的语义距离计算	第42-43页
·文本相似度度量	第43-44页
·类特征更新	第44页
·基于语义距离的邮件文本聚类方法	第44-46页
·第一次邮件文本聚类	第45页
·整理第一次聚类结果	第45页
·第二次邮件文本聚类	第45-46页
·垃圾邮件过滤	第46页
·本章小结	第46-47页
第5章基于语义体和文本聚类的垃圾邮件过滤验证实例	第47-55页
·测试平台及语料库	第47页
·机器配置	第47页
·实验语料库	第47页
·评价体系	第47页
·基于语义体与文本聚类的中文垃圾邮件过滤过程	第47-54页
·垃圾邮件过滤实例验证	第48-52页
·性能对比分析	第52-54页
·本章小结	第54-55页
总结与展望	第55-57页
参考文献	第57-64页
致谢	第64-65页
附录A 攻读硕士学位期间所发表的学术论文	第65页