首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互信息的文本自动分类特征选择方法研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-11页
   ·文本自动分类技术研究的背景、目的和意义第7页
   ·文本自动分类技术的研究现状第7-9页
   ·本文的主要内容与论文结构第9-11页
第二章 文本自动分类相关技术第11-24页
   ·文本自动分类的定义第11页
   ·文本自动分类模型第11-12页
   ·文本分词技术第12-14页
     ·基于字符串匹配的分词方法第12-13页
     ·基于统计的分词方法第13-14页
   ·去停用词第14-15页
   ·文本的特征选择第15-18页
     ·文本频度法第15-16页
     ·文本证据权第16页
     ·互信息第16-17页
     ·信息增益第17页
     ·期望交叉熵第17-18页
     ·CHI 统计第18页
   ·文本表示模型第18-20页
   ·文本分类算法第20-23页
     ·类中心向量法第20-22页
     ·K 近邻算法第22-23页
   ·本章小结第23-24页
第三章 互信息方法的改进第24-31页
   ·传统的互信息方法第24-27页
     ·传统互信息方法的缺陷第25-27页
   ·改进的互信息方法第27-30页
     ·类内平均频度第27-28页
     ·类内分散度第28页
     ·改进后的互信息方法第28-30页
   ·本章小结第30-31页
第四章 实验与结果分析第31-45页
   ·实验环境第31-32页
   ·文本自动分类的评估指标第32-33页
   ·语料库第33-34页
   ·文本预处理第34页
   ·文本分类第34-36页
     ·实验的分类算法第36页
   ·实验结果及分析第36-44页
   ·本章小结第44-45页
第五章 总结与展望第45-47页
   ·总结第45-46页
   ·下一步工作展望第46-47页
参考文献第47-50页
研究生期间发表论文第50-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:服务质量约束的网格工作流任务调度算法研究
下一篇:基于选择性变异技术的频率分配方法