基于潜在语义索引的文本聚类技术研究

摘要	第1-7页
Abstract	第7-12页
第1章引言	第12-17页
·研究背景和意义	第12-13页
·文本聚类存在的问题	第13-15页
·文本对象的高维性和稀疏性	第13-14页
·同义词和近义词问题	第14-15页
·效率与精确度之间的搭配问题	第15页
·国内外研究现状	第15-16页
·论文组织	第16-17页
第2章潜在语义索引及文本聚类概述	第17-28页
·潜在语义索引	第17-21页
·奇异值分解	第19-20页
·奇异值分解的几何解释	第20页
·利用奇异值分解计算各种相似关系	第20-21页
·文本聚类概述	第21-25页
·文本表示模型	第21-23页
·文本聚类算法	第23-25页
·聚类有效性评价	第25-28页
·熵（Entropy）	第25-26页
·F-Measure	第26页
·总体相似度（Overall Similarity）	第26-28页
第3章潜在语义索引中特征传递关系的选择	第28-44页
·特征传递关系	第28-31页
·文档内的特征传递关系	第29-31页
·文档之间的特征传递关系	第31页
·特征传递关系的选择	第31-34页
·实验与结果分析	第34-43页
·实验算法	第34-36页
·实验语料	第36-37页
·实验设计	第37-38页
·Complete-Linkage 算法的实验	第38-41页
·渐增式K-Means 算法的实验	第41-43页
·本章小结	第43-44页
第4章基于文本最小相似度的初始中心选取方法	第44-56页
·问题的提出	第44-45页
·K-MEANS 和K-MEDOIDS 算法	第45-46页
·K-Means 算法	第45-46页
·K-Medoids 算法	第46页
·初始中心点选取方法	第46-47页
·最小相似度和的初始点选取方法	第47-49页
·实验与结果分析	第49-54页
·实验语料	第49-50页
·实验设计	第50-51页
·实验结果分析	第51-54页
·本章小结	第54-56页
第5章系统实现	第56-61页
·系统框架	第56页
·关键技术的实现	第56-58页
·预处理	第56页
·潜在语义空间的构造	第56页
·检索过程	第56-58页
·改善检索结果	第58页
·实验与结果分析	第58-60页
·实验语料	第58页
·评测方法	第58-59页
·实验结果分析	第59-60页
·本章小结	第60-61页
结论	第61-63页
参考文献	第63-66页
致谢	第66-68页
攻读硕士期间发表（含录用）的学术论文	第68页