快速文本分类研究

摘要	第1-4页
ABSTRACT	第4-7页
第一章引言	第7-12页
·研究背景	第7页
·研究意义	第7-8页
·研究历史	第8-9页
·研究现状	第9-11页
·特征选择与压缩	第9页
·分类器组合	第9-10页
·小样本问题	第10页
·层次文本分类	第10页
·样本不均衡问题	第10-11页
·研究内容	第11-12页
第二章文本分类方法概述	第12-22页
·文本的表示	第12-14页
·文本向量的表示方法	第12-13页
·文本向量的特征权重表示方法	第13-14页
·分词方法	第14-15页
·基于字符串匹配的分词方法	第14页
·基于统计的分词方法	第14页
·专家系统分词方法	第14-15页
·神经网络的分词方法	第15页
·特征选择	第15-17页
·词频方法	第15页
·信息增益方法	第15-16页
·互信息方法	第16页
·交叉熵方法	第16页
·文本证据权方法	第16页
·CHI 统计方法	第16-17页
·几率比方法	第17页
·分类方法	第17-20页
·贝叶斯方法	第17-18页
·k 近邻方法	第18页
·决策树方法	第18页
·支持向量机方法	第18页
·神经网络方法	第18-19页
·基于投票的方法	第19页
·Rocchio 方法	第19页
·Sleeping Expert 方法	第19-20页
·分类算法评估指标	第20-22页
·召回率与精确率	第20页
·BEP 与F-Measure	第20-21页
·微平均与宏平均	第21-22页
第三章快速文本分类技术	第22-33页
·降维技术	第22-27页
·类别可分离性判据	第22-23页
·特征提取	第23-25页
·特征搜索	第25-26页
·特征排序	第26-27页
·索引技术	第27-31页
·R 树	第28-29页
·SS 树	第29-30页
·VP 树	第30页
·Grid 文件	第30-31页
·样本裁减	第31-33页
·最近邻编辑	第31-32页
·样本学习法	第32页
·样本修正法	第32-33页
第四章基于边界可信度相似的快速文本分类方法	第33-44页
·中心向量法和KNN 法的文本分类方法及特性	第33-35页
·中心向量法文本分类及其特性	第33-34页
·KNN 法文本分类及其特性	第34-35页
·基于边界可信度相似的快速文本分类思想	第35-36页
·基于边界可信度相似的快速文本分类方法	第36-38页
·边界距离定义及计算	第36页
·基于边界可信度的相似性度量	第36-37页
·基于边界可信度相似的快速文本分类算法	第37-38页
·实验设计与分析	第38-42页
·本章小结	第42-44页
第五章基于类别分布特征的快速文本分类方法	第44-51页
·类别分布特征对文本分类的影响	第44-45页
·平衡类别分布的策略	第45页
·基于类别分布特征的文本分类思想	第45-46页
·基于类别分布特征的文本分类方法	第46-47页
·自适应相似性度量	第46页
·基于类别分布特征的快速文本分类算法	第46-47页
·实验设计与分析	第47-50页
·本章小结	第50-51页
第六章总结与展望	第51-52页
·总结	第51页
·进一步研究及展望	第51-52页
致谢	第52-53页
参考文献	第53-56页
附录：作者在攻读硕士学位期间发表的论文	第56页