中文文本分类中的特征选择和权重计算方法研究

摘要	第1-5页
Abstract	第5-6页
目录	第6-8页
第1章绪论	第8-12页
·研究背景及意义	第8页
·国内外研究现状	第8-10页
·本文研究内容	第10页
·本文组织结构	第10-12页
第2章文本分类技术	第12-30页
·文本分类问题的描述	第12页
·文本分类任务的特点	第12-13页
·文本分类流程	第13-14页
·文本预处理	第14-16页
·中文分词	第14-15页
·去除停用词	第15-16页
·文本表示模型	第16-19页
·向量空间模型	第16-18页
·布尔模型	第18页
·概率模型	第18-19页
·图空间模型	第19页
·降维处理	第19-20页
·分类方法	第20-25页
·朴素贝叶斯方法	第21页
·KNN 方法	第21-22页
·支持向量机（SVM）	第22-23页
·神经网络方法	第23-24页
·决策树方法	第24-25页
·分类性能评估	第25-28页
·准确率和召回率	第26页
·F 评估	第26-27页
·宏平均与微平均	第27页
·平衡点（BEP）	第27-28页
·本章小结	第28-30页
第3章特征选择方法研究	第30-36页
·引言	第30页
·常用特征选择方法	第30-33页
·文档频率（DF）	第30-31页
·信息增益（IG）	第31页
·互信息（MI）	第31-32页
·卡方统计量（CHI）	第32-33页
·几率比(OR)	第33页
·期望交叉熵(ECE)	第33页
·特征选择函数的约束研究	第33-35页
·本章小结	第35-36页
第4章基于不均衡数据集文本分类的特征选择算法研究与改进	第36-44页
·概述	第36页
·不均衡数据集分类问题	第36-38页
·不均衡数据集分类问题的难点	第36-37页
·不均衡数据集分类问题的相关研究	第37-38页
·基于不均衡数据集上文本分类的特征选择方法	第38-40页
·实验设计与分析	第40-42页
·语料库	第40页
·分词	第40-41页
·分类算法和性能评估方法	第41页
·实验结果与分析	第41-42页
·本章小结	第42-44页
第5章特征词权重计算方法的改进	第44-52页
·常用的特征权重算法	第44页
·TF-IDF 的介绍	第44-46页
·基于 TF-IDF 的改进计算方法	第46-47页
·TF-IDF* λ IG	第47页
·TF-IDF* λ CHI	第47页
·实验设计与分析	第47-51页
·语料库	第47-48页
·KNN 算法中 K 值的确定	第48-49页
·实验结果与分析	第49-51页
·本章小结	第51-52页
第6章总结与展望	第52-54页
参考文献	第54-58页
攻读硕士学位期间所发表的学术论文	第58-60页
致谢	第60页