基于CSUAP和TextRank算法的短文本聚类研究

摘要	第4-5页
Abstract	第5-6页
第一章绪论	第10-15页
1.1 研究背景及意义	第10页
1.2 国内外研究现状	第10-12页
1.2.1 文本聚类相关研究	第10-11页
1.2.2 文本类簇信息提取相关研究	第11-12页
1.3 论文主要内容及结构安排	第12-15页
1.3.1 论文的主要内容	第12-13页
1.3.2 论文组织结构安排	第13-15页
第二章相关理论基础介绍	第15-25页
2.1 文本预处理	第15-16页
2.2 文本建模	第16-18页
2.2.1 布尔模型	第16-17页
2.2.2 向量空间模型	第17-18页
2.2.3 概率模型	第18页
2.3 文本相似度计算	第18-19页
2.4 文本特征降维方法	第19-20页
2.5 聚类算法	第20-24页
2.5.1 基于划分的聚类方法	第21-22页
2.5.2 基于层次的聚类方法	第22页
2.5.3 基于密度的聚类方法	第22-23页
2.5.4 基于网格的聚类方法	第23-24页
2.6 本章小结	第24-25页
第三章基于CSUAP算法的短文本聚类	第25-43页
3.1 TF-IDF的改进	第25-28页
3.1.1 词对的共现频度、支持度和置信度	第25-26页
3.1.2 传统TF-IDF的不足	第26-27页
3.1.3 引入关联语义权重的CO-TF-IDF	第27-28页
3.2 潜在语义分析	第28-31页
3.2.1 向量空间模型的局限性	第28-29页
3.2.2 潜在语义分析介绍	第29页
3.2.3 基于SVD的潜在语义分析	第29-31页
3.3 基于粗糙集的聚类算法	第31-35页
3.3.1 粗糙聚类算法简介	第31-32页
3.3.2 CSUAP算法	第32-34页
3.3.3 CSUAP算法与CSUA算法的分析比较	第34-35页
3.4 短文本聚类实验	第35-41页
3.4.1 实验流程	第35-36页
3.4.2 实验环境与数据	第36页
3.4.3 实验结果与分析	第36-41页
3.5 本章小结	第41-43页
第四章基于TextRank算法的短文本类簇信息提取	第43-53页
4.1 引言	第43-44页
4.2 基于Text Rank算法的代表文本提取	第44-47页
4.2.1 带边权重TextRank算法	第45-46页
4.2.2 不带边权重TextRank算法	第46-47页
4.3 短文本类簇关键词提取	第47-49页
4.3.1 关键词提取分析	第48页
4.3.2 关键词提取方法	第48-49页
4.4 实验	第49-52页
4.4.1 评估方法	第49-50页
4.4.2 实验结果与分析	第50-52页
4.5 本章小结	第52-53页
第五章短文本聚类分析系统	第53-56页
5.1 系统整体设计	第53-54页
5.2 系统界面	第54-55页
5.3 本章小结	第55-56页
第六章总结与展望	第56-58页
6.1 总结	第56-57页
6.2 展望	第57-58页
参考文献	第58-61页
攻读学位期间的研究成果	第61-62页
致谢	第62页