首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--安全保密论文

基于文本内容的垃圾短信过滤系统

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-17页
   ·研究背景和意义第11-12页
   ·国内外研究现状第12-14页
   ·研究内容第14-15页
     ·任务目标第14页
     ·难点分析第14页
     ·解决方案第14-15页
   ·本文的组织结构第15-17页
第2章 关键技术第17-31页
   ·文本的模型表示方法第17-18页
   ·特征选择方法第18-19页
     ·信息增益(Information Gain, IG)第18-19页
     ·卡方检验(CHI)第19页
     ·互信息(Mutual Information,MI)第19页
   ·特征权重第19-20页
   ·分类算法第20-27页
     ·决策树分类算法(Decision Tree)第21-22页
     ·朴素贝叶斯第22-24页
     ·支持向量机SVM(Support Vector Machine)第24-26页
     ·AdaBoost算法第26-27页
   ·主题模型第27-30页
     ·隐含狄利克雷分布(LDA主题模型)第27-29页
     ·Gibbs采样方法第29-30页
   ·本章小结第30-31页
第3章 特征选择及扩展第31-38页
   ·特征选择第31-33页
   ·特征扩展第33-36页
     ·短信特征分析第33-34页
     ·同义词扩展第34-36页
   ·特征权重第36-37页
     ·关键词特征权重第36页
     ·同义词特征权重第36页
     ·自定义特征权重第36-37页
   ·本章小结第37-38页
第4章 多层垃圾短信分类系统设计第38-43页
   ·决策树分类第39-40页
   ·非典型短信的预处理第40页
   ·AdaBoost贝叶斯分类第40-42页
   ·本章小结第42-43页
第5章 基于文本的多层垃圾短信过滤框架第43-60页
   ·流程设计第43-44页
   ·算法中各模块的设计第44-52页
     ·预处理第44-45页
     ·特征选择和扩展第45-46页
     ·自定义特征抽取第46-47页
     ·LDA主题模型的训练及预测第47-51页
     ·算法评估方法第51-52页
   ·实验环境第52页
     ·实验数据第52页
     ·实验工具第52页
   ·实验结果分析第52-59页
     ·基于不同特征集的对比实验第52-53页
     ·基于不同分类器的对比实验第53-54页
     ·基于不同基分类器的对比实验第54-55页
     ·各分类阶段不同阈值设定的对比实验第55-59页
   ·本章小结第59-60页
总结和展望第60-63页
参考文献第63-67页
攻读学位期间发表论文与研究成果清单第67-68页
致谢第68-69页

论文共69页,点击 下载论文
上一篇:面向雷达网分布式仿真的多线程交互技术
下一篇:DNAN基熔铸炸药空中爆炸能量输出规律研究