首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜在语义索引的文本分类技术的研究

声明第1-5页
摘要第5-7页
Abstract第7-9页
目录第9-12页
第一章 简介第12-20页
   ·研究背景第12页
   ·文本分类的应用第12-15页
     ·布尔信息检索系统的自动索引第13页
     ·文本组织第13页
     ·文本过滤第13-14页
     ·词义消歧第14页
     ·网页层次分类第14-15页
   ·文本分类系统第15-17页
     ·预处理第15页
     ·降维第15-16页
     ·格式化第16页
     ·训练分类器第16页
     ·测试文本预处理第16页
     ·分类和输出第16页
     ·评测第16-17页
   ·潜在语义索引第17页
   ·研究现状及发展趋势第17-18页
   ·本文的工作第18-19页
   ·本文的组织第19-20页
第二章 相关背景知识第20-26页
   ·分类效果评测第20-23页
     ·正确率和召回率第20-21页
     ·其它一些有效性的评价方法第21页
     ·非有效性的评价方法第21-22页
     ·有效性评价的组合第22-23页
   ·语料第23-24页
     ·语料的预处理第24页
   ·KNN分类器第24-26页
     ·KNN在文本分类中的应用第25-26页
第三章 特征选取与权重计算第26-33页
   ·文本表示第26页
     ·禁用词第26页
   ·特征选取第26-30页
     ·文档频度第27-28页
     ·信息增益第28页
     ·互信息第28-29页
     ·X~2统计第29页
     ·相对熵第29-30页
   ·权重计算第30-33页
     ·布尔权重第30页
     ·特征频度第30页
     ·TF-IDF权重第30-31页
     ·熵权重第31页
     ·组合权重第31-33页
第四章 潜在语义索引第33-55页
   ·向量空间模型的缺点第33页
   ·潜在语义索引出现的背景第33-34页
   ·潜在语义索引第34-35页
   ·奇异值分解第35-41页
     ·奇异值分解的几何解释第37-38页
     ·利用奇异值分解计算各种相似关系第38-39页
     ·伪文本的表示第39页
     ·奇异值分解的例子第39-41页
   ·半离散矩阵分解第41-45页
     ·SDD的生成第42-44页
     ·半离散矩阵分解的例子第44-45页
   ·试验结果与分析第45-55页
     ·数据稀疏对LSI的影响第46-51页
       ·分析第46-51页
     ·权重计算方法对LSI的影响第51页
       ·分析第51页
     ·特征选取方法对LSI的影响第51-55页
       ·分析第54-55页
第五章 改进模型第55-62页
   ·传统模型的缺点第55-56页
   ·改进模型第56-57页
   ·试验结果第57-62页
     ·改进模型的试验第57-59页
       ·分析第59页
     ·SVD与SDD效果对比第59-62页
       ·分析第61-62页
结论第62-64页
 1 研究工作总结第62-63页
 2 将来的工作第63-64页
参考文献第64-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:上市公司盈余管理与监管制度研究
下一篇:地下经济规模测算方法初探