基于向量空间模型的文本分类算法研究

摘要	第1-6页
ABSTRACT	第6-11页
第一章绪论	第11-16页
·研究目的和意义	第11-12页
·国内外研究现状	第12-15页
·论文结构安排	第15-16页
第二章 VSM文本分类的数学模型	第16-24页
·文本数据预处理	第16-18页
·文本分词	第16-17页
·特征提取	第17-18页
·消除停用词	第18页
·VSM模型建立	第18-21页
·向量空间模型简介	第18-19页
·词条权重的计算	第19-20页
·相似度的测量	第20-21页
·文本分类的方法	第21-23页
·分割式分类算法(Partitioning Methods)	第21-22页
·阶层式分类算法(Hierarchical Methods)	第22页
·基于模型的分类算法(Model-Based Methods)	第22-23页
·本章小结	第23-24页
第三章语义本体库在文本分类中的应用	第24-33页
·概念词典的建立	第24-26页
·HowNet简介	第24-25页
·义原层次结构	第25-26页
·词语义项的表征方法及其可计算性	第26-28页
·基于义原的表征方法及其可计算性	第26-27页
·基于概念依存关系的表征方法及其可计算性	第27-28页
·二维结构表征方法及其可计算性	第28页
·语义相似性计算	第28-32页
·词语相似度	第28-30页
·语句相似度	第30-31页
·文本相似度	第31-32页
·本章小结	第32-33页
第四章基于语义扩展的VSM分类算法	第33-51页
·建立原始向量空间模型	第33-37页
·文本预处理	第33-34页
·TF-IDF权重计算	第34-36页
·原始向量空间模型建立	第36-37页
·基于概念进行向量空间降维	第37-41页
·引入概念降维必要性分析	第37-38页
·概念同义词辨识	第38-40页
·基于同义词集合语义降维	第40-41页
·VSM向量空间语义扩展	第41-48页
·语义层次树分析	第42页
·VSM语义建立扩展向量	第42-43页
·扩展文本相似度算法	第43-45页
·文本举例	第45-48页
·文本分类	第48-50页
·分类策略	第48-49页
·分类指标	第49-50页
·本章小结	第50-51页
第五章实验过程与结果分析	第51-61页
·实验环境	第51-52页
·实验平台	第51页
·实验语料	第51-52页
·分词系统	第52页
·评估指标	第52-53页
·实验过程	第53-54页
·训练过程	第53页
·分类过程	第53-54页
·实验结果分析	第54-60页
·小型文本分类	第54-55页
·改进的VSM算法与传统算法分类精度对比	第55-57页
·改进的VSM算法对向量空间维数的影响	第57-60页
·本章小结	第60-61页
结论	第61-63页
致谢	第63-64页
参考文献	第64-68页
附录	第68-69页
详细摘要	第69-72页