一种基于关键向量的文本分类模型的研究

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-15页
·论文研究的的背景及意义	第9-10页
·国内外研究现状	第10-12页
·本文研究内容及论文组织结构	第12-15页
第2章向量空间模型	第15-24页
·文本表示	第15-18页
·特征项抽取作为文本特征	第15-17页
·特征项权重计算 TF-IDF 公式	第17-18页
·相似度计算	第18页
·向量空间模型	第18-19页
·向量空间模型的基本概念	第18-19页
·向空间模型的特点	第19页
·常用的文本分类算法	第19-23页
·本章小结	第23-24页
第3章基于关键向量的文本分类算法	第24-32页
·基本思路介绍	第24-28页
·传统的基于向量空间模型算法的不足	第24-25页
·早期的改进思路	第25-27页
·算法的评价	第27-28页
·基于关键向量的文本分类算法介绍	第28-30页
·相关概念的引入	第28页
·新算法的工作原理	第28-30页
·相关阈值的确定	第30-31页
·K 值的确定	第30-31页
·k_1 和k_2 值的确定	第31页
·本章小结	第31-32页
第4章系统实现	第32-41页
·实验设计	第32页
·系统模型	第32-34页
·系统实现	第34-37页
·文本收集	第34页
·预处理	第34-35页
·文档的向量化	第35-36页
·关键向量的计算	第36-37页
·测试	第37页
·主要算法描述	第37-40页
·词频统计模块	第37-38页
·关键向量查找模块	第38-39页
·文本分类模块	第39-40页
·本章小结	第40-41页
第5章测试	第41-53页
·测试语料库	第41-45页
·文件格式	第41页
·文件内部标签	第41-43页
·类别	第43-45页
·实验环境说明	第45-46页
·评价标准	第46页
·实验过程及结果	第46-51页
·实验一：K 值的选取对分类效果的影响	第46-47页
·实验二：分类文件数量对分类效果的影响	第47-49页
·实验三：与其它分类算法的比较	第49-50页
·算法的时间性能分析	第50-51页
·实验讨论	第51-52页
·本章小结	第52-53页
结　论	第53-54页
附录：分类器实现的主要代码	第54-62页
参考文献	第62-66页
攻读硕士学位期间发表的学术论文	第66-67页
致谢	第67页