一种基于向量空间的多语言反垃圾短信系统的设计和实现

摘要	第1-4页
Abstract	第4-5页
目录	第5-7页
1 绪论	第7-12页
·研究背景	第7-8页
·研究内容及现状	第8-10页
·自然语言文本分类的基本概念	第8-9页
·国内外文本分类技术的研究与发展	第9-10页
·自动文本分类在反垃圾短信中的具体含义	第10页
·本文内容与结构组织	第10-12页
·本文内容	第10-11页
·论文结构	第11-12页
2 文本分类中常用的机器学习方法	第12-21页
·向量空间模型	第12-14页
·贝叶斯学习	第14-16页
·支持向量机	第16-17页
·k近邻	第17-18页
·TFIDF	第18-19页
·本章小结	第19-21页
3 中文文本自动分词	第21-28页
·中文文本分词方法简介	第21-25页
·基于词典的机械分词法	第21-23页
·基于统计的分词法	第23-24页
·基于自然语言理解的分词法	第24-25页
·分词算法中的难题	第25-26页
·对未登录词的识别	第25页
·歧义切分字段	第25-26页
·本章小结	第26-28页
4 训练模块	第28-45页
·反垃圾短信系统的总体模块组成	第28-29页
·训练模块的各组成步骤	第29-30页
·分词	第30-39页
·对词典进行排序	第31-34页
·统计常用的人名用字	第34-35页
·在词典中为人名用字做上标记	第35-36页
·为加了标记的词典建立索引文件	第36-37页
·利用词典和相对应的索引文件进行分词	第37-39页
·属性提取	第39-41页
·计算各个词的权重	第39-41页
·得到属性列表	第41页
·训练样本向量化	第41-42页
·得到类别中心向量	第42-44页
·本章小结	第44-45页
5 训练结果评测模块	第45-50页
·测试样本向量化	第45-46页
·识别率定义及预测评估	第46-48页
·正负识别率定义	第46页
·预测及评估	第46-48页
·本章小结	第48-50页
6 用户端模块	第50-55页
·本系统的自动调用	第50页
·截取所接收短信的内容	第50-51页
·把所接收的短信向量化	第51-52页
·对短信进行识别	第52-54页
·本章小结	第54-55页
7 总结与展望	第55-56页
致谢	第56-57页
参考文献	第57-58页