基于潜在语义索引的文本分类技术的研究

声明	第1-5页
摘要	第5-7页
Abstract	第7-9页
目录	第9-12页
第一章简介	第12-20页
·研究背景	第12页
·文本分类的应用	第12-15页
·布尔信息检索系统的自动索引	第13页
·文本组织	第13页
·文本过滤	第13-14页
·词义消歧	第14页
·网页层次分类	第14-15页
·文本分类系统	第15-17页
·预处理	第15页
·降维	第15-16页
·格式化	第16页
·训练分类器	第16页
·测试文本预处理	第16页
·分类和输出	第16页
·评测	第16-17页
·潜在语义索引	第17页
·研究现状及发展趋势	第17-18页
·本文的工作	第18-19页
·本文的组织	第19-20页
第二章相关背景知识	第20-26页
·分类效果评测	第20-23页
·正确率和召回率	第20-21页
·其它一些有效性的评价方法	第21页
·非有效性的评价方法	第21-22页
·有效性评价的组合	第22-23页
·语料	第23-24页
·语料的预处理	第24页
·KNN分类器	第24-26页
·KNN在文本分类中的应用	第25-26页
第三章特征选取与权重计算	第26-33页
·文本表示	第26页
·禁用词	第26页
·特征选取	第26-30页
·文档频度	第27-28页
·信息增益	第28页
·互信息	第28-29页
·X~2统计	第29页
·相对熵	第29-30页
·权重计算	第30-33页
·布尔权重	第30页
·特征频度	第30页
·TF-IDF权重	第30-31页
·熵权重	第31页
·组合权重	第31-33页
第四章潜在语义索引	第33-55页
·向量空间模型的缺点	第33页
·潜在语义索引出现的背景	第33-34页
·潜在语义索引	第34-35页
·奇异值分解	第35-41页
·奇异值分解的几何解释	第37-38页
·利用奇异值分解计算各种相似关系	第38-39页
·伪文本的表示	第39页
·奇异值分解的例子	第39-41页
·半离散矩阵分解	第41-45页
·SDD的生成	第42-44页
·半离散矩阵分解的例子	第44-45页
·试验结果与分析	第45-55页
·数据稀疏对LSI的影响	第46-51页
·分析	第46-51页
·权重计算方法对LSI的影响	第51页
·分析	第51页
·特征选取方法对LSI的影响	第51-55页
·分析	第54-55页
第五章改进模型	第55-62页
·传统模型的缺点	第55-56页
·改进模型	第56-57页
·试验结果	第57-62页
·改进模型的试验	第57-59页
·分析	第59页
·SVD与SDD效果对比	第59-62页
·分析	第61-62页
结论	第62-64页
1 研究工作总结	第62-63页
2 将来的工作	第63-64页
参考文献	第64-67页
致谢	第67页