基于内容的垃圾短信过滤技术研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第10-16页 |
1.1 课题研究背景 | 第10-11页 |
1.2 垃圾短信治理现状 | 第11-14页 |
1.2.1 垃圾短信定义 | 第11-12页 |
1.2.2 垃圾短信泛滥及成因 | 第12-13页 |
1.2.3 垃圾短信监管情况 | 第13-14页 |
1.3 课题探讨内容 | 第14-15页 |
1.4 论文结构安排 | 第15-16页 |
第二章 垃圾短信过滤技术背景介绍 | 第16-24页 |
2.1 垃圾短信过滤技术分类 | 第16-18页 |
2.1.1 基于号码黑白名单的垃圾短信过滤技术 | 第16-17页 |
2.1.2 基于内容的垃圾短信过滤技术 | 第17-18页 |
2.2 相关技术介绍 | 第18-24页 |
2.2.1 中文分词技术 | 第18-20页 |
2.2.2 特征提取方法 | 第20-21页 |
2.2.3 特征赋值方法 | 第21-22页 |
2.2.4 中文文本分类技术 | 第22-24页 |
第三章 短信样本准备及评价标准 | 第24-31页 |
3.1 短信样本收集 | 第24页 |
3.2 短信样本分类 | 第24-27页 |
3.2.1 正常短信 | 第24-25页 |
3.2.2 垃圾短信 | 第25-27页 |
3.3 短信传统特征 | 第27-29页 |
3.4 垃圾短信过滤评价标准 | 第29-31页 |
第四章 基于决策树的垃圾短信过滤系统 | 第31-44页 |
4.1 决策树概念介绍 | 第31-32页 |
4.2 决策树学习算法 | 第32-37页 |
4.2.1 基本原理 | 第32-33页 |
4.2.2 ID3算法 | 第33页 |
4.2.3 C4.5算法 | 第33页 |
4.2.4 WEKA介绍 | 第33-37页 |
4.3 基于决策树的垃圾短信过滤系统 | 第37-38页 |
4.3.1 系统设计 | 第37页 |
4.3.2 训练过程 | 第37-38页 |
4.3.3 预测过程 | 第38页 |
4.4 决策树的分类属性选取 | 第38-41页 |
4.4.1 传统短信特征属性 | 第38-40页 |
4.4.2 新短信特征属性 | 第40-41页 |
4.4.3 关键词特征属性 | 第41页 |
4.5 实验结果及其分析 | 第41-44页 |
4.5.1 实验过程 | 第41页 |
4.5.2 结果分析 | 第41-44页 |
第五章 基于支持向量机的垃圾短信过滤系统 | 第44-54页 |
5.1 支持向量机概念介绍 | 第44页 |
5.2 支持向量机学习算法 | 第44-47页 |
5.2.1 支持向量机基本思想及数学模型 | 第44-45页 |
5.2.2 核函数的选择 | 第45-46页 |
5.2.3 libSVM介绍 | 第46-47页 |
5.3 基于支持向量机的垃圾短信过滤系统 | 第47-48页 |
5.3.1 系统设计 | 第47页 |
5.3.2 训练过程 | 第47-48页 |
5.3.3 预测过程 | 第48页 |
5.4 支持向量机的分类特征选取 | 第48-49页 |
5.4.1 语义特征属性 | 第48-49页 |
5.4.2 非语义特征属性 | 第49页 |
5.5 实验结果及其分析 | 第49-54页 |
5.5.1 实验过程 | 第49-52页 |
5.5.2 结果分析 | 第52-54页 |
第六章 总结与展望 | 第54-57页 |
6.1 两种过滤系统比较 | 第54-55页 |
6.2 论文工作总结 | 第55-56页 |
6.3 下一步工作展望 | 第56-57页 |
参考文献 | 第57-60页 |
致谢 | 第60-61页 |
攻读学位期间发表的学术论文目录 | 第61页 |