文本分类特征选取技术研究

摘要	第1-6页
ABSTRACT	第6-8页
目录	第8-11页
图表目录	第11-12页
第一章引言	第12-15页
·课题研究背景及意义	第12-13页
·国内外研究现状	第13-14页
·本文的主要内容	第14-15页
第二章文本分类的概念和向量空间模型	第15-26页
·文本分类的概念	第15-18页
·现代文本分类的基础理论—机器学习	第15-16页
·文本分类的定义	第16-18页
·向量空间模型	第18-20页
·分类系统的性能评价	第20-22页
·常用的评估参数介绍	第20-22页
·其他一些评估参数介绍	第22页
·粗糙集理论	第22-25页
·粗糙集的基本概念	第22-24页
·决策表的离散化	第24-25页
·将粗糙集理论用于文本分类的可行性分析	第25-26页
第三章文本分类系统中关键技术问题	第26-46页
·系统总体框架	第26页
·文本的预处理	第26-27页
·文本预处理方法	第26-27页
·基于词性选择的文本预处理	第27页
·特征选择方法	第27-31页
·文档频率	第27-28页
·互信息	第28页
·信息增益	第28-29页
·期望交叉熵	第29-30页
·文本证据权(WET)	第30页
·基于互信息改扩展的特征选择方法(EMI)	第30-31页
·互信息(MI)存在的不足	第30-31页
·构造思想	第31页
·特征项权重公式	第31-33页
·布尔权重	第32页
·词频权重	第32页
·TF-IDF权重	第32-33页
·文本分类方法	第33-39页
·朴素贝叶斯分类法(NB)	第33-34页
·K-邻近算法	第34-35页
·支持向量机算法	第35-39页
·支持向量机线性可分模式的最优超平面构造	第36-37页
·支持向量机线性不可分模式的最优超平面构造	第37-38页
·常用核函数介绍	第38-39页
·分类方法对比研究	第39-40页
·几种方法的比较	第39-40页
·实验系统的各项参数	第40页
·实验用语料库	第40-41页
·实验结果与分析	第41-46页
第四章基于粗糙集属性约简的特征选择方法	第46-51页
·基于粗糙集属性约简的特征选择方法	第46-49页
·文本预处理	第46页
·决策表的建立	第46-47页
·决策表的离散化	第47页
·基于属性重要度的条件属性约简	第47-49页
·特征的选择	第49页
·实验结果及其分析	第49-51页
第五章中文文本自动分类工具的设计与实现	第51-57页
·分类工具的体系结构	第51-54页
·主要功能模块介绍	第54-57页
·文本处理及特征选择模块	第54-55页
·文本分类模块	第55-56页
·分类测试与结果评估模块	第56-57页
第六章总结与展望	第57-59页
·本文主要工作和创新点	第57页
·不足及对未来的展望	第57-59页
参考文献	第59-61页
致谢	第61页