首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类的特征选择方法研究

摘要第1-5页
ABSTRACT第5-9页
图表清单第9-10页
注释表第10-11页
第一章 绪论第11-16页
   ·研究的目的和意义第11-12页
   ·国内外研究现状第12-14页
   ·本文所做的工作和组织结构第14-16页
     ·本文所做的工作第14页
     ·本文的组织结构第14-16页
第二章 文本分类的基础理论和相关技术第16-24页
   ·文本分类的基础理论第16-18页
     ·文本分类基本概念第16页
     ·文本聚类第16-17页
     ·文本分类的过程第17页
     ·文本分类的难点第17-18页
   ·文本分类的相关技术第18-23页
     ·文本预处理第18-20页
     ·文本表示第20-22页
     ·权重计算第22-23页
     ·特征选择第23页
     ·分类算法第23页
   ·本章小结第23-24页
第三章 特征选择算法第24-35页
   ·特征选择概述第24-25页
   ·常用的特征选择算法第25-29页
     ·特征频率(TF)第25页
     ·文档频率(DF)第25-26页
     ·信息增益(IG)第26-27页
     ·互信息(MI)第27-28页
     ·期望交叉熵(ECE)第28页
     ·χ2 统计法(CHI)第28-29页
   ·基于熵的TFIDF 公式用于特征选择(TDE)第29-34页
     ·TFIDF 公式第29-30页
     ·传统TFIDF 分析第30-32页
       ·词条对分类的重要程度第30-31页
       ·TFIDF 分析第31-32页
     ·改进的TFIDF 方法(TDE)第32-34页
       ·信息熵理论第32页
       ·特征词的类内熵和类间熵第32-34页
     ·基于改进的TFIDF 特征选择方法(TDE)第34页
   ·本章小结第34-35页
第四章 文本分类算法第35-42页
   ·类中心法(Rocchio)第35-36页
   ·朴素贝叶斯法(NB)第36-38页
   ·K 近邻方法(KNN)第38页
   ·支持向量机(SVM)第38-40页
   ·决策树(DT)第40页
   ·神经网络方法第40-41页
   ·本章小结第41-42页
第五章 实验与分析第42-49页
   ·分类效果的评价体系第42-44页
     ·影响分类效果的主要因素第42-43页
     ·分类效果的评价方法第43-44页
   ·特征选择方法的实验与分析第44-47页
   ·三种分类方法的实验比较第47-48页
   ·本章小结第48-49页
第六章 总结与展望第49-51页
   ·论文主要工作第49页
   ·下一步工作及展望第49-51页
参考文献第51-55页
致谢第55-56页
在学期间的研究成果及发表的论文第56页

论文共56页,点击 下载论文
上一篇:基于分布式数据仓库和数据挖掘的TSCICDSS
下一篇:嵌入式软件覆盖测试的插桩技术研究