首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于信息熵的中文文本分类算法研究

摘要第1-5页
Abstract第5-6页
目录第6-9页
第一章 绪论第9-14页
   ·文本分类的研究背景和意义第9-10页
   ·文本分类技术的研究现状第10-12页
     ·文本分类在国外的发展第10-11页
     ·文本分类在国内的发展第11-12页
   ·本文工作第12-13页
   ·本文课题来源和内容组织第13-14页
     ·本文课题来源第13页
     ·本文内容组织第13-14页
第二章 文本分类概述第14-30页
   ·文本分类的基本概念第14-15页
     ·文本分类问题描述第14页
     ·文本分类的技术路线第14-15页
   ·文本表示模型第15-17页
     ·文本表示方法第15-16页
     ·向量空间模型第16-17页
   ·分词方法第17-19页
     ·基于字符串匹配的分词方法第18页
     ·基于统计的分词方法第18页
     ·专家系统分词方法第18-19页
     ·神经网络的分词方法第19页
   ·文本特征选择第19-22页
     ·词频方法第20页
     ·信息增益方法第20页
     ·互信息方法第20-21页
     ·交叉熵方法第21页
     ·文本证据权方法第21页
     ·CHI统计方法第21-22页
   ·文本分类方法第22-28页
     ·贝叶斯方法第22-23页
     ·KNN方法——k近邻方法第23-24页
     ·支持向量机法第24-27页
     ·类中心分类法第27页
     ·神经网络算法第27-28页
   ·分类算法评估第28-30页
第三章 信息论度量第30-35页
   ·信息论与数据挖掘第30-31页
     ·通信传输过程第30-31页
     ·信息传输与数据挖掘第31页
   ·信息熵第31-33页
   ·条件熵第33-34页
   ·互信息第34-35页
第四章 关键词集抽取算法模型第35-42页
   ·基于字符串匹配的分词方法第35-36页
   ·基于统计的分词方法第36-37页
   ·字符串匹配方法与统计方法比较第37页
   ·关键词集抽取算法第37-39页
     ·关键短语的界定第37-38页
     ·中文分词第38页
     ·文本预处理第38-39页
     ·关键词集抽取第39页
   ·关键词集抽取实验第39-42页
     ·实验环境第39-40页
     ·实验过程及结果第40-41页
     ·实验结果分析第41-42页
第五章 基于信息熵的文本分类系统设计与分析第42-49页
   ·系统设计的目的和意义第42页
   ·系统框架第42-43页
   ·基于熵的分类模型第43-45页
     ·算法流程第44-45页
     ·关键算法第45页
   ·数据集第45-46页
     ·训练集和测试集第45-46页
     ·语料库的选取第46页
   ·文本分类实验第46-49页
     ·实验环境第46-47页
     ·实验过程及结果第47-48页
     ·实验结果分析第48-49页
第六章 结束语第49-50页
   ·总结第49页
   ·下一步工作展望第49-50页
参考文献第50-54页
致谢第54-55页
在读硕士期间发表的学术论文第55页

论文共55页,点击 下载论文
上一篇:面部整复术的应用解剖学研究
下一篇:镍电解阳极液萃取除钴研究