中文文本分类特征选择方法的分析与研究

摘要	第1-4页
Abstract	第4-10页
第一章绪论	第10-16页
·研究背景及意义	第10-11页
·研究现状	第11-13页
·国外研究现状	第11-12页
·国内研究现状	第12-13页
·论文研究内容	第13-14页
·论文结构	第14-16页
第二章文本分类相关技术概述	第16-34页
·文本分类过程	第16-17页
·语料集	第17-18页
·均衡语料集	第18页
·不均衡语料集	第18页
·文本预处理	第18-20页
·分词	第18-19页
·词干抽取	第19-20页
·停用词处理	第20页
·特征降维	第20-23页
·特征变换	第21页
·特征选择	第21-23页
·常用的特征选择方法	第23-25页
·文档频数(Document Frequency)	第23-24页
·互信息(Mutual Information)	第24页
·信息增益(Information Gain)	第24-25页
·期望交叉熵(Expected Cross Entropy)	第25页
·卡方统计(CHI)	第25页
·文本表示模型	第25-27页
·概率模型	第26页
·布尔模型	第26页
·向量空间模型	第26-27页
·不同分类算法	第27-31页
·K邻近分类算法	第28-29页
·SVM分类算法	第29-30页
·贝叶斯分类算法	第30-31页
·分类性能评价标准	第31-33页
·查全率和查准率	第31-32页
·宏平均和微平均	第32-33页
·本章小结	第33-34页
第三章信息增益特征选择方法的研究	第34-44页
·引言	第34-35页
·信息增益特征选择方法	第35-36页
·信息熵	第35页
·条件熵	第35-36页
·信息增益特征选择方法	第36页
·信息增益方法的不足及改进方案	第36-38页
·实验验证	第38-42页
·语料集	第38-39页
·分类算法	第39页
·比例因子α的取值	第39-40页
·实验分析	第40-42页
·改进后的算法复杂度分析	第42页
·本章小结	第42-44页
第四章互信息特征选择方法的研究	第44-52页
·引言	第44页
·互信息特征选择方法	第44-46页
·联合熵	第44-45页
·互信息	第45-46页
·互信息特征选择方法的分析与改进	第46-48页
·实验数据及分析	第48-50页
·语料集	第48-49页
·分类器	第49页
·实验分析	第49-50页
·改进后的算法复杂度分析	第50页
·本章小结	第50-52页
第五章中文文本分类系统的设计与实现	第52-68页
·开发环境	第52页
·设计分类系统需考虑的因素	第52-53页
·分类系统设计	第53-59页
·文本分类流程	第53页
·系统用例图	第53-54页
·系统主要模块分析与设计	第54-58页
·系统详细设计	第58-59页
·分类系统实现	第59-64页
·划分语料集功能实现	第59-60页
·训练模块实现	第60-62页
·分类模块实现	第62-63页
·结果评估及显示模块实现	第63-64页
·各种特征选择方法在不同分类器上的性能比较	第64-66页
·实验环境	第64页
·语料集	第64-65页
·实验数据及分析	第65-66页
·本章小结	第66-68页
总结与展望	第68-72页
1. 总结	第68-70页
2. 展望	第70-72页
参考文献	第72-76页
攻读学位期间发表的论文	第76-77页
致谢	第77页