首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于特征选择和特征加权算法的文本分类研究

目录第1-6页
摘要第6-7页
ABSTRACT第7-9页
第一章 绪论第9-12页
   ·研究背景和研究意义第9-10页
   ·国内外研究现状第10-11页
   ·论文的研究内容第11页
   ·组织结构第11-12页
第二章 文本分类相关技术第12-25页
   ·文本分类的定义第12页
   ·文本分类流程第12-13页
   ·文本分类预处理第13-16页
     ·分词第13-14页
     ·去停用词第14-15页
     ·文本表示第15-16页
   ·特征降维第16-17页
   ·特征加权第17页
   ·常用的文本分类算法第17-21页
     ·Rocchio 算法第17-18页
     ·朴素贝叶斯算法第18-19页
     ·K-最近邻算法第19-20页
     ·支持向量机算法第20-21页
   ·文本分类系统性能评估第21-24页
     ·评价方法第21-22页
     ·评价指标第22-24页
   ·本章小结第24-25页
第三章 基于词频信息的改进信息增益文本特征选择算法第25-31页
   ·常用的特征选择算法第25-27页
     ·文档频度(Document Frequency,DF)第25页
     ·互信息(Mutual Information,MI)第25-26页
     ·χ2 统计量(Chi-square,CHI)第26页
     ·期望交叉熵(Expected Cross Entropy,ECE)第26页
     ·文本证据权(Weight of Evidence,WE)第26页
     ·信息增益(Information Gain,IG)第26-27页
   ·信息增益算法现状分析第27-28页
   ·信息增益算法的改进第28-30页
     ·类内词频信息对算法的影响及改进第28-29页
     ·类内词频位置分布对算法的影响及改进第29页
     ·类间词频信息对算法的影响及改进第29-30页
   ·本章小结第30-31页
第四章 结合特征项类内和类间分布改进的 TF-IDF 算法第31-39页
   ·特征项权重算法第31-33页
     ·布尔权重(Boolean Weighting)第31页
     ·熵权重(Entropy Weighting)第31页
     ·词频权重(Term Frequency,TF)第31-32页
     ·反文档频率(Inverse Document Frequency,IDF)第32页
     ·TF-IDF 函数第32-33页
   ·TF-IDF 算法的不足第33-35页
   ·结合类内和类间分布情况的改进 TF-IDF 算法第35-38页
     ·针对 IDF 的改进第35-36页
     ·基于熵的参数因子第36-38页
   ·本章小结第38-39页
第五章 实验与结果分析第39-49页
   ·分类实验介绍第39页
   ·实验结果分析第39-47页
     ·分类算法 KNN 中 K 值的确定第39-40页
     ·改进 IG 算法的对比试验第40-44页
     ·改进 TF-IDF 算法的对比试验第44-47页
   ·本章小结第47-49页
第六章 总结与展望第49-51页
   ·总结第49页
   ·展望第49-51页
参考文献第51-54页
攻硕期间发表论文及科研成果第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:基于颜色一致性的图像阴影消除算法研究
下一篇:基于上下文的图像理解算法研究