基于X~2统计的中文文本分类特征选择方法研究

摘要	第1-6页
ABSTRACT	第6-8页
第一章绪论	第8-14页
·研究背景和意义	第8-9页
·国内外文本分类研究现状综述	第9-12页
·文本分类介绍	第9-10页
·特征选择介绍	第10页
·国内外研究现状	第10-12页
·本文的研究内容	第12-14页
·本文的主要工作	第12页
·本文的组织	第12-14页
第二章文本分类技术	第14-29页
·文本分类的定义	第14-15页
·文本分类任务流程	第15-17页
·文本表示模型	第17-18页
·向量空间模型	第17页
·布尔模型	第17-18页
·概率模型	第18页
·常用的文本分类方法	第18-26页
·Naive Bayes方法	第19-20页
·KNN方法	第20-21页
·类中心向量法	第21-22页
·神经网络	第22-24页
·支持向量机	第24-25页
·决策树方法	第25-26页
·文本分类方法的性能评估	第26-28页
·查全率与查准率、宏平均与微平均	第26-27页
·BEP(Break-even point)和F1(F-measure)	第27-28页
·本章小结	第28-29页
第三章特征选择方法研究	第29-33页
·特征选择方法概述	第29-30页
·常用的特征选择方法及评价	第30-32页
·文档频率(DF)	第30-31页
·信息增益(IG)	第31页
·互信息(MI)	第31-32页
·X~2统计(CHI)	第32页
·本章小结	第32-33页
第四章基于改进的X~2统计方法的特征选择	第33-41页
·传统的X~2统计方法	第33-34页
·应用举例	第34-35页
·X~2统计方法的不足	第35-36页
·改进的X~2统计方法	第36-38页
·文档内频度	第36页
·类内正确度	第36-37页
·改进后X~2统计方法	第37-38页
·中文文本分类系统	第38-40页
·文本分类系统框架	第38-39页
·特征选择系统	第39-40页
·分类系统	第40页
·本章小结	第40-41页
第五章实验与结果分析	第41-48页
·数据来源及实验参数选择	第41-42页
·数据来源	第41页
·实验参数选择	第41-42页
·文本分类实验结果分析	第42-47页
·混淆矩阵	第42-44页
·各个类的查全率、查准率、F1值	第44页
·总体查全率、查准率、F1值	第44-45页
·各个类的分类情况图形显示	第45-47页
·本章小结	第47-48页
第六章总结与展望	第48-50页
·本文的工作总结	第48页
·进一步的工作	第48-50页
参考文献	第50-54页
致谢	第54-55页
附录	第55页