首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本特征选择算法的研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-13页
   ·研究背景及意义第9-10页
   ·研究现状第10-11页
   ·论文的相关内容第11页
   ·论文的结构安排第11-13页
2 文本分类技术简介第13-29页
   ·基本概念第13-14页
   ·文本分类的语料库第14页
   ·文本分类流程第14-16页
   ·文本预处理第16页
     ·分词第16页
     ·词性分析第16页
     ·消除停用词第16页
   ·文本表示第16-18页
     ·布尔模型第16-17页
     ·向量空间模型第17-18页
   ·特征降维第18-20页
   ·文本分类算法第20-23页
     ·KNN 分类方法第20-21页
     ·朴素贝叶斯第21-22页
     ·支持向量机分类方法第22-23页
   ·测评第23-24页
   ·常用的特征选择方法第24-27页
     ·文档频率第24-25页
     ·互信息第25-26页
     ·信息增益第26页
     ·X~2统计量第26-27页
   ·本章小结第27-29页
3 基于信息增益特征关联树的文本特征选择算法第29-36页
   ·信息增益算法分析第29-30页
   ·改进信息增益算法第30-34页
     ·基于类内特征关联树模型去除冗余特征第30-32页
     ·基于类间加权离散度的信息增益公式改进第32-34页
     ·基于信息增益特征关联树的特征选择算法的描述第34页
   ·本章小结第34-36页
4 基于改进信息增益的垃圾博客过滤算法第36-41页
   ·博客页面的 URL 和超链接的特征分析第36-37页
     ·URL 的 Abnormal 和 Normal 名单第36页
     ·链接锚文本第36-37页
   ·基于改进的信息增益的垃圾博客过滤算法第37-40页
     ·利用改进的信息增益公式分类提取特征第37-38页
     ·利用互斥信息过滤负相关特征第38页
     ·特征值个数的考虑第38-39页
     ·基于改进的信息增益的垃圾博客过滤算法的描述第39-40页
   ·小结第40-41页
5 实验数据及结果分析第41-45页
   ·基于信息增益特征关联树文本特征选择算法实验第41-43页
   ·基于改进信息增益的垃圾博客过滤算法实验第43-45页
结论第45-47页
参考文献第47-51页
攻读硕士学位期间发表学术论文情况第51-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:基于Chord算法的云用户信任模型
下一篇:基于内容的图像检索若干关键问题研究