基于短文本的邮件过滤技术研究

摘要	第1-5页
ABSTRACT	第5-9页
1 绪论	第9-19页
·研究背景和意义	第9-12页
·垃圾邮件的概念和产生来源	第10页
·垃圾邮件的危害	第10-11页
·文本情感计算的主要研究领域	第11-12页
·国内外研究现状	第12-17页
·反垃圾邮件技术研究现状	第12-14页
·基于内容的邮件过滤技术研究现状	第14-16页
·文本情感分类的应用现状	第16-17页
·本文的主要工作	第17页
·论文的组织安排	第17-19页
2 邮件过滤系统	第19-32页
·电子邮件工作原理	第19-23页
·电子邮件系统的基本协议	第19-20页
·标准邮件格式特征分析	第20-22页
·TCP/IP体系结构	第22-23页
·邮件过滤方法	第23-26页
·基于地址的邮件过滤方法	第24-25页
·基于内容的邮件过滤方法	第25-26页
·反垃圾邮件研究	第26-30页
·非技术手段反垃圾邮件	第26-27页
·技术手段反垃圾邮件	第27-30页
·垃圾邮件过滤与文本情感分类	第30-31页
·反馈学习技术	第31-32页
3 文本情感分类算法的研究与分析	第32-50页
·文本情感分析	第32-43页
·情感的经典理论	第32-33页
·关键词的抽取算法	第33-34页
·真实文本评测值的获取	第34-43页
·文本情感倾向的确定	第43页
·中文句式分析	第43-45页
·单句情感计算	第44页
·复句情感计算	第44-45页
·文本内容识别系统	第45-50页
·特定领域中三类关键词的抽取	第45-46页
·关键词的识别	第46-47页
·语料学习过程	第47-48页
·真实文本识别过程	第48页
·阈值的设定	第48-50页
4 垃圾邮件过滤技术研究	第50-65页
·中文分词	第50-53页
·中文分词的概念和重要性	第50页
·中文分词的规范	第50-51页
·去除停用词	第51页
·中文分词的主要方法	第51-53页
·文本特征项的选择与提取	第53-56页
·文本信息的表示	第56-58页
·布尔模型(Boolean Model)	第56-57页
·概率模型(Probabistic Model)	第57页
·向量空间模型(Vector Space Model)	第57-58页
·基于内容的邮件文本分类方法	第58-62页
·基于规则的过滤方法	第59-60页
·基于统计的过滤方法	第60-62页
·邮件过滤常用语料库	第62-65页
·PU1语料	第62-63页
·Ling-Spam语料	第63-64页
·Spam Assassin语料	第64页
·Spambase语料	第64-65页
5 客户端邮件过滤系统的设计与实现	第65-76页
·设计目标	第65页
·系统总体设计	第65-66页
·开发环境介绍	第65-66页
·实验平台搭建	第66页
·系统框架图	第66页
·系统实现	第66-73页
·系统的实现步骤	第67页
·基于POP3协议的邮件接收器	第67-68页
·文本情感分析模块	第68-69页
·文本文件分析模块	第69-71页
·语料学习模块	第71-73页
·实验结果及分析	第73-76页
·垃圾邮件过滤系统评价体系	第73-74页
·实验结果及分析	第74-76页
6 总结与展望	第76-77页
参考文献	第77-80页
在学研究成果	第80-81页
致谢	第81页