| 中文摘要 | 第1-4页 |
| 英文摘要 | 第4-8页 |
| 1 绪论 | 第8-14页 |
| ·文本聚类分析概述 | 第8-11页 |
| ·聚类简介 | 第8页 |
| ·聚类算法概述 | 第8-10页 |
| ·文本聚类研究历史和现状 | 第10-11页 |
| ·谱聚类算法概述 | 第11-12页 |
| ·谱聚类算法简介 | 第11页 |
| ·谱聚类算法发展与现状 | 第11-12页 |
| ·谱聚类的一些问题 | 第12页 |
| ·潜在语义分析简介 | 第12-13页 |
| ·论文的研究内容与章节安排 | 第13-14页 |
| ·本文的主要工作 | 第13页 |
| ·本文的组织 | 第13-14页 |
| 2 谱聚类算法 | 第14-27页 |
| ·引言 | 第14页 |
| ·聚类分析技术概述 | 第14-19页 |
| ·聚类分析中的数据类型 | 第14页 |
| ·聚类分析中的相似度度量方法 | 第14-17页 |
| ·聚类分析中的聚类准则函数 | 第17-19页 |
| ·图论相关技术 | 第19-22页 |
| ·图的数学表示 | 第19-20页 |
| ·图的矩阵表示 | 第20页 |
| ·图的拉普拉斯矩阵的性质 | 第20-22页 |
| ·谱聚类的数学解释 | 第22-25页 |
| ·基于图划分的谱聚类算法 | 第22-25页 |
| ·典型谱聚类算法 | 第25-26页 |
| ·小结 | 第26-27页 |
| 3 潜在语义分析 | 第27-32页 |
| ·引言 | 第27页 |
| ·向量空间模型文本表示模型的不足 | 第27-30页 |
| ·特征项频率(Term Frequency:TF) | 第27页 |
| ·反文档频率(Inverse Document Frequency:IDF) | 第27-28页 |
| ·向量空间模型表示模型的不足 | 第28-30页 |
| ·潜在语义分析技术 | 第30-31页 |
| ·奇异值(Singular Value Decomposition:SVD)分解 | 第30页 |
| ·奇异值分解在潜在语义分析中的应用 | 第30-31页 |
| ·小结 | 第31-32页 |
| 4 结合 LSA 的文本谱聚类算法 | 第32-36页 |
| ·引言 | 第32页 |
| ·相似矩阵构造问题 | 第32-34页 |
| ·使用LSA 方法构造相似矩阵 | 第34-35页 |
| ·结合LSA 的文本谱聚类算法 | 第35页 |
| ·小结 | 第35-36页 |
| 5 实验结果与分析 | 第36-51页 |
| ·引言 | 第36页 |
| ·实验主要流程 | 第36页 |
| ·实验详细介绍 | 第36-39页 |
| ·数据集 | 第36-37页 |
| ·构造初始词条文档矩阵 | 第37页 |
| ·SVD 分解 | 第37页 |
| ·谱聚类过程 | 第37-38页 |
| ·实验评价标准 | 第38-39页 |
| ·权重函数 | 第39页 |
| ·实验结果 | 第39-48页 |
| ·简化的LSA 算法 | 第48-51页 |
| 6 结语 | 第51-52页 |
| ·总结 | 第51页 |
| ·下一步的工作 | 第51-52页 |
| 致谢 | 第52-53页 |
| 参考文献 | 第53-55页 |
| 附录 | 第55页 |
| A. 作者在攻读学位期间发表的论文目录 | 第55页 |
| B. 作者在攻读硕士学位期间所参与的科研课题 | 第55页 |