首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

变体短文本过滤算法研究

摘要第1-5页
ABSTRACT第5-7页
目录第7-9页
第一章 绪论第9-13页
   ·背景介绍第9页
   ·变体短文本过滤的应用前景分析第9-11页
   ·变体短文本过滤的特点与难点第11页
   ·本文的主要工作和内容安排第11-13页
第二章 现有短文本过滤方法及相关技术的研究与分析第13-29页
   ·现有的垃圾、有害短文本处理方法及存在问题第13-19页
     ·自然语言的构造模型相关方法第13-16页
     ·基于内容的相关过滤方法第16-19页
   ·当前变体短文本的解决方法分析第19-20页
   ·本文提出算法涵盖的相关技术第20-29页
     ·分类技术:朴素贝叶斯分类算法第20-21页
     ·中文分字及相关文本处理技术第21-22页
     ·文档频率与逆文档频率(TF-IDF)第22-23页
     ·去停用词第23-24页
     ·ROC曲线第24-27页
     ·决策树理论第27-29页
第三章 基于层次特征的变体短文本过滤算法中的概念及算法框架第29-33页
   ·算法相关概念详解和原理描述第29-31页
   ·算法总体结构第31-33页
第四章 基于层次特征的变体短文本过滤算法的核心算法与关键技术第33-48页
   ·基于层次特征的变体短文本过滤算法第33-37页
     ·基于层次特征的变体短文本过滤模块设计第33-34页
     ·子模块介绍第34-35页
     ·特征权值的设定及计算第35-37页
   ·关键词权值及层次特征训练权值的确定第37-41页
   ·层次特征的权值处理第41-43页
   ·通过ROC曲线确定最佳工作点第43-45页
   ·验证层次特征的权值处理的有效性第45-48页
第五章 实验过程及结果分析第48-56页
   ·实验语料、初始关键词表(无权值)及关键字替换字表的确定第48-50页
     ·实验语料的选取第48页
     ·关键字替换字表及初始关键词表的确定第48-50页
   ·实验过程详述及结果分析第50-56页
     ·训练过程第50-51页
     ·实验结果及分析第51-56页
第六章 总结第56-59页
   ·算法研究过程第56-57页
   ·后续工作展望第57页
   ·总结第57-59页
参考文献第59-61页
致谢第61-62页
作者攻读学位期间发表的学术论文目录第62页

论文共62页,点击 下载论文
上一篇:基于surf算法的快速车辆牌照定位与跟踪系统
下一篇:数字图像篡改鉴定的数学特征研究