基于内容的短信息过滤系统研究
第1章 绪论 | 第1-18页 |
·引言 | 第8页 |
·垃圾短信的定义、解决方法及基本特征 | 第8-9页 |
·基于短信内容过滤的主要技术及发展现状 | 第9-17页 |
·短信息的传递过程 | 第9-10页 |
·自然语言的构造模型 | 第10-13页 |
·基于内容过滤的主要方法 | 第13-17页 |
·本文的主要工作及内容安排 | 第17-18页 |
第2章 分词 | 第18-29页 |
·分词的基本思路 | 第18-19页 |
·汉语自动分词的基本原则 | 第19-20页 |
·汉语自动分词基本算法 | 第20-22页 |
·字符串近似匹配算法 | 第20页 |
·最少分词法(N——最短路径法) | 第20-21页 |
·基于统计模型的分词方法 | 第21-22页 |
·基于HMM(隐马尔可夫模型)的标注方法 | 第22-23页 |
·汉语自动分词中的歧义消除方法 | 第23-24页 |
·汉语自动分词中的未登陆词识别 | 第24-28页 |
·评测结论 | 第28页 |
·本章小结 | 第28-29页 |
第3章 贝叶斯过滤 | 第29-40页 |
·贝叶斯文本分类算法的两种模型 | 第29-34页 |
·多变量贝努里事件模型 | 第31-33页 |
·多项式事件模型 | 第33-34页 |
·朴素贝叶斯算法 | 第34-35页 |
·基于最小风险的朴素贝叶斯决策 | 第35-37页 |
·实验结果 | 第37-39页 |
·本章小结 | 第39-40页 |
第4章 语义过滤 | 第40-55页 |
·汉语词语相似度的计算 | 第40-51页 |
·词语相似度与词语距离 | 第40-41页 |
·《知网(Hownet)》简介 | 第41-46页 |
·基于《知网》的语义相似度计算方法 | 第46-50页 |
·对知网相似度计算模块的测试 | 第50-51页 |
·短信语句相似度的计算及分类 | 第51-54页 |
·垃圾短信语义模型 | 第51-52页 |
·K最邻近分类 | 第52-53页 |
·测试实验 | 第53-54页 |
·本章小结 | 第54-55页 |
第5章 基于内容的手机短信息过滤系统 | 第55-61页 |
·系统的整体结构 | 第55-56页 |
·特征集合 | 第56页 |
·构造分类器 | 第56-60页 |
·人工神经网络技术的应用 | 第57-59页 |
·测试结果及分析 | 第59-60页 |
·本章小结 | 第60-61页 |
结论 | 第61-63页 |
参考文献 | 第63-66页 |
致谢 | 第66页 |