中文摘要 | 第1-4页 |
英文摘要 | 第4-8页 |
1 绪论 | 第8-14页 |
·文本聚类分析概述 | 第8-11页 |
·聚类简介 | 第8页 |
·聚类算法概述 | 第8-10页 |
·文本聚类研究历史和现状 | 第10-11页 |
·谱聚类算法概述 | 第11-12页 |
·谱聚类算法简介 | 第11页 |
·谱聚类算法发展与现状 | 第11-12页 |
·谱聚类的一些问题 | 第12页 |
·潜在语义分析简介 | 第12-13页 |
·论文的研究内容与章节安排 | 第13-14页 |
·本文的主要工作 | 第13页 |
·本文的组织 | 第13-14页 |
2 谱聚类算法 | 第14-27页 |
·引言 | 第14页 |
·聚类分析技术概述 | 第14-19页 |
·聚类分析中的数据类型 | 第14页 |
·聚类分析中的相似度度量方法 | 第14-17页 |
·聚类分析中的聚类准则函数 | 第17-19页 |
·图论相关技术 | 第19-22页 |
·图的数学表示 | 第19-20页 |
·图的矩阵表示 | 第20页 |
·图的拉普拉斯矩阵的性质 | 第20-22页 |
·谱聚类的数学解释 | 第22-25页 |
·基于图划分的谱聚类算法 | 第22-25页 |
·典型谱聚类算法 | 第25-26页 |
·小结 | 第26-27页 |
3 潜在语义分析 | 第27-32页 |
·引言 | 第27页 |
·向量空间模型文本表示模型的不足 | 第27-30页 |
·特征项频率(Term Frequency:TF) | 第27页 |
·反文档频率(Inverse Document Frequency:IDF) | 第27-28页 |
·向量空间模型表示模型的不足 | 第28-30页 |
·潜在语义分析技术 | 第30-31页 |
·奇异值(Singular Value Decomposition:SVD)分解 | 第30页 |
·奇异值分解在潜在语义分析中的应用 | 第30-31页 |
·小结 | 第31-32页 |
4 结合 LSA 的文本谱聚类算法 | 第32-36页 |
·引言 | 第32页 |
·相似矩阵构造问题 | 第32-34页 |
·使用LSA 方法构造相似矩阵 | 第34-35页 |
·结合LSA 的文本谱聚类算法 | 第35页 |
·小结 | 第35-36页 |
5 实验结果与分析 | 第36-51页 |
·引言 | 第36页 |
·实验主要流程 | 第36页 |
·实验详细介绍 | 第36-39页 |
·数据集 | 第36-37页 |
·构造初始词条文档矩阵 | 第37页 |
·SVD 分解 | 第37页 |
·谱聚类过程 | 第37-38页 |
·实验评价标准 | 第38-39页 |
·权重函数 | 第39页 |
·实验结果 | 第39-48页 |
·简化的LSA 算法 | 第48-51页 |
6 结语 | 第51-52页 |
·总结 | 第51页 |
·下一步的工作 | 第51-52页 |
致谢 | 第52-53页 |
参考文献 | 第53-55页 |
附录 | 第55页 |
A. 作者在攻读学位期间发表的论文目录 | 第55页 |
B. 作者在攻读硕士学位期间所参与的科研课题 | 第55页 |