结合概率潜在语义分析的文本谱聚类研究

摘要	第1-4页
ABSTRACT	第4-8页
1 绪论	第8-13页
·研究背景和意义	第8-9页
·文件聚类的研究现状	第9-10页
·谱聚类算法的研究现状和应用	第10-11页
·本文的研究内容及组织结构	第11-13页
·本文的研究内容	第11页
·本文的结构安排	第11-13页
2 谱聚类概述	第13-32页
·引言	第13页
·文本聚类分析概述	第13-16页
·文本聚类相关技术	第16-19页
·聚类分析中文本表示	第16-18页
·相似度测量	第18-19页
·谱聚类算法	第19-24页
·谱聚类算法简介	第19页
·谱图理论和划分准则	第19-22页
·典型的谱聚类算法	第22-24页
·向量空间模型	第24-28页
·向量空间模型描述	第24-26页
·向量空间模型表示文本的不足	第26-28页
·概率潜在语义分析概述	第28页
·概率潜在语义分析技术	第28-31页
·模型假设	第28-30页
·EM 算法	第30-31页
·小结	第31-32页
3 结合概率潜在语义分析的文本谱聚类	第32-38页
·引言	第32页
·相似矩阵构造问题	第32-33页
·使用概率潜在语义分析构造相似矩阵	第33-35页
·结合 pLSA 的文本谱聚类算法	第35-37页
·小结	第37-38页
4 实验结果与分析	第38-50页
·引言	第38页
·实验主要流程	第38-39页
·实验及效果评价分析	第39-41页
·数据集	第39页
·构造初始词条文档矩阵	第39页
·PLSA 处理词条文本	第39-40页
·谱聚类过程	第40页
·实验评价标准	第40-41页
·实验结果	第41-49页
·小结	第49-50页
5 结语	第50-52页
·本文总结	第50-51页
·下一步的研究工作	第51-52页
致谢	第52-53页
参考文献	第53-56页
附录	第56页
A. 作者在攻读学位期间发表的论文目录	第56页
B. 作者在攻读硕士学位期间所参与的科研课题	第56页