文本分类中特征选择的研究与实现

摘要	第1-4页
Abstract	第4-8页
第一章绪论	第8-13页
·研究背景	第8-9页
·研究现状	第9-10页
·研究内容	第10-11页
·论文组织	第11-13页
第二章中文文本分类技术	第13-29页
·文本分类过程	第13页
·语料库	第13-14页
·文本预处理	第14-16页
·中文分词	第14-15页
·去除停用词	第15-16页
·词干还原	第16页
·文本表示	第16-17页
·向量空间模型	第16-17页
·概率模型	第17页
·LSA模型	第17页
·特征降维	第17-23页
·特征选择步骤	第18-20页
·特征选择的分类	第20-22页
·典型特征选择算法介绍	第22-23页
·常用的特征选择方法	第23-25页
·互信息	第23页
·信息增益	第23-24页
·CHI统计方法	第24-25页
·文档频率	第25页
·分类算法	第25-27页
·线性分类算法	第25-26页
·非线性分类算法	第26-27页
·分类评价标准	第27-28页
·查全率	第28页
·查准率	第28页
·平均F1值	第28页
·本章小结	第28-29页
第三章互信息特征选择方法分析与改进	第29-40页
·引言	第29-30页
·互信息特征选择方法	第30-32页
·信息熵	第30-31页
·联合熵与条件熵	第31页
·互信息特征选择方法	第31-32页
·互信息特征选择方法的改进	第32-34页
·调整正负相关特征比例	第32-33页
·区分类强相关特征	第33-34页
·实验结果及分析	第34-39页
·语料集	第34页
·分类器	第34页
·平衡因子α选取	第34-35页
·实验数据	第35-39页
·本章小结	第39-40页
第四章卡方统计特征选择方法分析与改进	第40-50页
·引言	第40-41页
·卡方检验和卡方统计	第41-42页
·卡方检验	第41页
·卡方统计	第41-42页
·卡方统计特征选择方法	第42页
·卡方统计特征选择方法改进	第42-45页
·选择低频特征	第42-43页
·选择高频特征	第43-44页
·选择强相关特征	第44-45页
·实验结果	第45-49页
·语料集	第46页
·分类器	第46页
·实验数据	第46-49页
·本章小结	第49-50页
第五章文本分类系统的设计与实现	第50-64页
·开发环境与开发工具	第50页
·开发系统考虑因素	第50-51页
·分类系统体系结构	第51-52页
·系统设计	第52-56页
·系统用例图及用例描述	第52-53页
·系统功能模块设计	第53-54页
·系统概要设计	第54-56页
·系统实现	第56-61页
·训练集选择模块实现	第56-58页
·文本训练模块实现	第58-59页
·文本分类模块实现	第59-60页
·结果评测模块实现	第60-61页
·常用特征选择方法分类效果研究	第61-63页
·实验环境	第61页
·语料库选取	第61-62页
·实验结果分析	第62-63页
·本章小结	第63-64页
总结与展望	第64-66页
参考文献	第66-69页
攻读学位期间发表的论文	第69-70页
致谢	第70页