首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于信息增益和信息熵的特征词权重计算研究

摘要第1-4页
ABSTRACT第4-9页
1 绪论第9-13页
   ·课题研究背景第9页
   ·国内外研究现状第9-11页
   ·本文主要研究内容第11-12页
     ·研究目的第11页
     ·研究内容第11-12页
   ·论文结构第12-13页
2 文本分类相关理论及技术第13-28页
   ·文本分类概述第13-14页
   ·文本预处理第14-15页
     ·文本分词第14-15页
     ·去低频词和停用词第15页
   ·特征选择第15-18页
     ·文档频率第16页
     ·互信息第16-17页
     ·信息增益第17页
     ·χ~2统计量第17页
     ·交叉熵第17-18页
     ·Fisher 判别式第18页
   ·文本表示第18-20页
     ·布尔模型(Boolean Model)第18页
     ·概率模型(Probabilistic Model)第18-19页
     ·空间向量模型(Vector Space Model)第19-20页
   ·特征词权重计算第20页
   ·文本分类算法第20-25页
     ·基于统计的分类算法第20-23页
     ·神经网络的方法第23-24页
     ·基于规则的方法第24-25页
   ·分类器性能评估第25-27页
   ·本章小结第27-28页
3 特征词权重计算方法第28-36页
   ·特征词权重算法第28-30页
     ·布尔权重法第28页
     ·信噪比第28-29页
     ·熵权重第29页
     ·词频率法第29页
     ·反文档频率法第29-30页
     ·TFIDF 方法第30页
   ·TFIDF 算法及其改进第30-34页
     ·TFIDF 算法分析第30-32页
     ·TFIDF 算法的改进第32-34页
   ·本章小结第34-36页
4 基于信息增益和信息熵的特征词权重计算第36-44页
   ·信息熵第36-37页
   ·信息增益第37-38页
   ·基于信息增益的 TFIDF 算法第38-40页
   ·基于信息熵和信息增益的 TFIDF 算法改进第40-43页
   ·本章小结第43-44页
5 实验结果及分析第44-55页
   ·实验介绍第44-47页
     ·实验目的与平台第44页
     ·实验流程第44-45页
     ·实验过程参数第45-47页
   ·实验结果分析第47-54页
     ·特征降维实验第47-50页
     ·TFIDFIGE 算法有效性验证实验第50-53页
     ·实验结论第53-54页
   ·本章小结第54-55页
6 总结与展望第55-56页
致谢第56-57页
参考文献第57-60页
附录第60页
 A. 作者在攻读硕士学位期间发表的论文目录第60页
 B. 作者攻读学位期间参加的科研项目第60页

论文共60页,点击 下载论文
上一篇:基于OpenCL的频繁项集挖掘研究
下一篇:时变网络的链接预测研究