文本聚类关键技术研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-15页
1.1 研究背景及意义	第9-10页
1.2 国内外研究现状及发展趋势	第10-13页
1.3 本文章节安排和课题来源	第13-15页
第2章相关技术介绍	第15-25页
2.1 文本建模	第15-19页
2.1.1 向量空间模型	第15-16页
2.1.2 基于向量空间模型的相似度	第16页
2.1.3 主题概率模型	第16-18页
2.1.4 基于主题概率模型的相似度	第18-19页
2.2 文本向量降维技术	第19-21页
2.2.1 特征选择	第19-20页
2.2.2 特征抽取	第20-21页
2.3 文本聚类算法	第21-24页
2.3.1 K-means聚类算法	第22-23页
2.3.2 Canopy聚类算法	第23-24页
2.4 本章小结	第24-25页
第3章文本聚类系统框架	第25-35页
3.1 文本聚类系统框架总体模型	第25页
3.2 系统具体流程	第25-34页
3.2.1 文本预处理层	第25-27页
3.2.2 文本建模层	第27-28页
3.2.3 文本向量降维层	第28-32页
3.2.4 主题向量抽取层	第32-33页
3.2.5 文本聚类层	第33-34页
3.3 本章小结	第34-35页
第4章基于LDA的K-means文本聚类算法	第35-42页
4.1 确定主题数目	第36页
4.2 初始聚类中心生成	第36-38页
4.2.1 面向聚类的LDA候选主题选取	第36-38页
4.2.2 获取初始聚类中心	第38页
4.3 可确定性证明	第38-40页
4.4 改进后算法时间复杂度分析	第40页
4.5 本章小结	第40-42页
第5章实验及结果分析	第42-46页
5.1 数据集简介及结果评估指标	第42-43页
5.2 实验结果分析	第43-45页
5.3 本章小结	第45-46页
第6章工作总结与展望	第46-48页
6.1 研究总结	第46页
6.2 展望	第46-48页
参考文献	第48-52页
在学期间发表的学术论文	第52-53页
攻读硕士学位期间参加的科研工作	第53-54页
致谢	第54页