首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

一种基于向量空间的多语言反垃圾短信系统的设计和实现

摘要第1-4页
Abstract第4-5页
目录第5-7页
1 绪论第7-12页
   ·研究背景第7-8页
   ·研究内容及现状第8-10页
     ·自然语言文本分类的基本概念第8-9页
     ·国内外文本分类技术的研究与发展第9-10页
     ·自动文本分类在反垃圾短信中的具体含义第10页
   ·本文内容与结构组织第10-12页
     ·本文内容第10-11页
     ·论文结构第11-12页
2 文本分类中常用的机器学习方法第12-21页
   ·向量空间模型第12-14页
   ·贝叶斯学习第14-16页
   ·支持向量机第16-17页
   ·k近邻第17-18页
   ·TFIDF第18-19页
   ·本章小结第19-21页
3 中文文本自动分词第21-28页
   ·中文文本分词方法简介第21-25页
     ·基于词典的机械分词法第21-23页
     ·基于统计的分词法第23-24页
     ·基于自然语言理解的分词法第24-25页
   ·分词算法中的难题第25-26页
     ·对未登录词的识别第25页
     ·歧义切分字段第25-26页
   ·本章小结第26-28页
4 训练模块第28-45页
   ·反垃圾短信系统的总体模块组成第28-29页
   ·训练模块的各组成步骤第29-30页
   ·分词第30-39页
     ·对词典进行排序第31-34页
     ·统计常用的人名用字第34-35页
     ·在词典中为人名用字做上标记第35-36页
     ·为加了标记的词典建立索引文件第36-37页
     ·利用词典和相对应的索引文件进行分词第37-39页
   ·属性提取第39-41页
     ·计算各个词的权重第39-41页
     ·得到属性列表第41页
   ·训练样本向量化第41-42页
   ·得到类别中心向量第42-44页
   ·本章小结第44-45页
5 训练结果评测模块第45-50页
   ·测试样本向量化第45-46页
   ·识别率定义及预测评估第46-48页
     ·正负识别率定义第46页
     ·预测及评估第46-48页
   ·本章小结第48-50页
6 用户端模块第50-55页
   ·本系统的自动调用第50页
   ·截取所接收短信的内容第50-51页
   ·把所接收的短信向量化第51-52页
   ·对短信进行识别第52-54页
   ·本章小结第54-55页
7 总结与展望第55-56页
致谢第56-57页
参考文献第57-58页

论文共58页,点击 下载论文
上一篇:我国竞技体育夏季奥运项目构成变化与发展战略研究
下一篇:IP协议与CCSDS协议的转换