基于信息熵的中文文本分类算法研究

摘要	第1-5页
Abstract	第5-6页
目录	第6-9页
第一章绪论	第9-14页
·文本分类的研究背景和意义	第9-10页
·文本分类技术的研究现状	第10-12页
·文本分类在国外的发展	第10-11页
·文本分类在国内的发展	第11-12页
·本文工作	第12-13页
·本文课题来源和内容组织	第13-14页
·本文课题来源	第13页
·本文内容组织	第13-14页
第二章文本分类概述	第14-30页
·文本分类的基本概念	第14-15页
·文本分类问题描述	第14页
·文本分类的技术路线	第14-15页
·文本表示模型	第15-17页
·文本表示方法	第15-16页
·向量空间模型	第16-17页
·分词方法	第17-19页
·基于字符串匹配的分词方法	第18页
·基于统计的分词方法	第18页
·专家系统分词方法	第18-19页
·神经网络的分词方法	第19页
·文本特征选择	第19-22页
·词频方法	第20页
·信息增益方法	第20页
·互信息方法	第20-21页
·交叉熵方法	第21页
·文本证据权方法	第21页
·CHI统计方法	第21-22页
·文本分类方法	第22-28页
·贝叶斯方法	第22-23页
·KNN方法——k近邻方法	第23-24页
·支持向量机法	第24-27页
·类中心分类法	第27页
·神经网络算法	第27-28页
·分类算法评估	第28-30页
第三章信息论度量	第30-35页
·信息论与数据挖掘	第30-31页
·通信传输过程	第30-31页
·信息传输与数据挖掘	第31页
·信息熵	第31-33页
·条件熵	第33-34页
·互信息	第34-35页
第四章关键词集抽取算法模型	第35-42页
·基于字符串匹配的分词方法	第35-36页
·基于统计的分词方法	第36-37页
·字符串匹配方法与统计方法比较	第37页
·关键词集抽取算法	第37-39页
·关键短语的界定	第37-38页
·中文分词	第38页
·文本预处理	第38-39页
·关键词集抽取	第39页
·关键词集抽取实验	第39-42页
·实验环境	第39-40页
·实验过程及结果	第40-41页
·实验结果分析	第41-42页
第五章基于信息熵的文本分类系统设计与分析	第42-49页
·系统设计的目的和意义	第42页
·系统框架	第42-43页
·基于熵的分类模型	第43-45页
·算法流程	第44-45页
·关键算法	第45页
·数据集	第45-46页
·训练集和测试集	第45-46页
·语料库的选取	第46页
·文本分类实验	第46-49页
·实验环境	第46-47页
·实验过程及结果	第47-48页
·实验结果分析	第48-49页
第六章结束语	第49-50页
·总结	第49页
·下一步工作展望	第49-50页
参考文献	第50-54页
致谢	第54-55页
在读硕士期间发表的学术论文	第55页