基于支持向量机的手机垃圾短信过滤器的研究
摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
第一章 绪论 | 第7-17页 |
§1-1 问题的提出 | 第7-8页 |
§1-2 关键技术介绍 | 第8-16页 |
1-2-1 中文分词 | 第8-9页 |
1-2-2 特征降维 | 第9-12页 |
1-2-3 文本表示 | 第12-13页 |
1-2-4 文本分类算法 | 第13-16页 |
§1-3 本文的主要内容及创新点 | 第16-17页 |
1-3-1 本文的主要内容 | 第16页 |
1-3-2 文本主要创新点 | 第16-17页 |
第二章 支持向量机理论基础及数学模型 | 第17-29页 |
§2-1 统计学习理论和支持向量机基础 | 第17-19页 |
2-1-1 统计学习一致性条件 | 第17-18页 |
2-1-2 推广性的界 | 第18页 |
2-1-3 结构风险最小化 | 第18-19页 |
§2-2 SVM数学模型的建立过程 | 第19-25页 |
2-2-1 线性可分情形与最优分类超平面 | 第20-22页 |
2-2-2 线性不可分情形与软间隔 | 第22-23页 |
2-2-3 非线性情形与核函数 | 第23-24页 |
2-2-4 支持向量机算法描述 | 第24-25页 |
§2-3 支持向量机的特点及优势 | 第25-27页 |
§2-4 支持向量机在文本分类中的应用研究 | 第27-29页 |
第三章 基于SVM垃圾短信过滤器的设计 | 第29-38页 |
§3-1 系统总体模型的设计 | 第29-30页 |
§3-2 基于SVM垃圾短信过滤器系统的总体设计 | 第30-31页 |
§3-3 短信分词模块的设计 | 第31-32页 |
§3-4 特征降维模块的设计 | 第32-36页 |
3-4-1 特征降维模块的设计 | 第32-33页 |
3-4-2 模块中的特征降维方法 | 第33-36页 |
§3-5 短信的文本表示模块的设计 | 第36页 |
§3-6 自动分类模块的设计 | 第36-38页 |
第四章 实验及结果分析 | 第38-45页 |
§4-1 系统所用短信集及词典的构建 | 第38-39页 |
4-1-1 训练集和测试集 | 第38页 |
4-1-2 词典的构建 | 第38-39页 |
§4-2 实验环境 | 第39页 |
§4-3 评价指标和准则 | 第39页 |
§4-4 特征降维算法对比实验 | 第39-42页 |
4-4-1 特征降维算法比较 | 第40页 |
4-4-2 PCA算法 | 第40-41页 |
4-4-3 特征数的确定 | 第41-42页 |
§4-5 改进的短信的文本表示方法 | 第42页 |
§4-6 分类算法实验结果及评价 | 第42-44页 |
4-6-1 SVM代价敏感惩罚参数 | 第42-43页 |
4-6-2 SVM核函数 | 第43-44页 |
4-6-3 SVM与NN比较实验 | 第44页 |
§4-7 实验结果的应用 | 第44-45页 |
第五章 结论 | 第45-46页 |
§5-1 论文完成的主要工作 | 第45页 |
§5-2 研究工作展望 | 第45-46页 |
参考文献 | 第46-49页 |
附录A | 第49-50页 |
致谢 | 第50页 |