基于语义的文本聚类算法研究

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 引言	第12-18页
1.1 研究背景和意义	第12-13页
1.2 国内外研究现状	第13-16页
1.3 本文主要内容及组织结构	第16-18页
1.3.1 本文主要研究内容	第16页
1.3.2 本文组织结构	第16-18页
2 文本聚类相关技术	第18-34页
2.1 文本聚类的概念	第18页
2.2 文本聚类过程	第18-19页
2.3 文本预处理	第19-21页
2.3.1 分词	第19-20页
2.3.2 停用词过滤	第20页
2.3.3 词干提取	第20-21页
2.4 文本表示	第21-26页
2.4.1 文本表示模型	第22-23页
2.4.2 特征降维	第23-25页
2.4.3 特征权值计算	第25-26页
2.5 文本相似度算法	第26-27页
2.6 文本聚类算法	第27-31页
2.7 文本聚类结果评价	第31-33页
2.8 本章小结	第33-34页
3 基于连续词向量语义消歧的文本聚类	第34-47页
3.1 WordNet语义词典	第34-38页
3.1.1 WordNet简介	第35-36页
3.1.2 WordNet中语义关系	第36-38页
3.2 神经网络语言模型	第38-40页
3.2.1 语言模型概述	第38页
3.2.2 神经网络语言模型	第38页
3.2.3 word2vec模型框架	第38-40页
3.3 基于连续词向量的语义消歧算法	第40-43页
3.3.1 算法思想及原理	第41页
3.3.2 算法具体实现	第41-43页
3.4 基于连续词向量语义消歧的文本聚类算法	第43-45页
3.4.1 语义消歧对于文本聚类的意义	第43页
3.4.2 算法描述	第43-45页
3.5 本章小结	第45-47页
4 基于连续词向量和概念簇的文本聚类	第47-53页
4.1 特征降维算法综述	第47-48页
4.2 基于概念簇的特征降维算法	第48-50页
4.2.1 算法思想及原理	第48-49页
4.2.2 算法具体实现	第49-50页
4.3 基于连续词向量和概念簇的文本聚类算法	第50-52页
4.4 本章小结	第52-53页
5 实验及结果分析	第53-62页
5.1 实验环境	第53页
5.2 实验数据	第53-54页
5.3 文本聚类性能评估方法	第54-55页
5.3.1 文本聚类准确性评估方法	第54页
5.3.2 文本聚类准确性比较标准	第54-55页
5.3.3 特征降维比较标准	第55页
5.4 算法实现中相关参数设置	第55-56页
5.5 对比实验结果及分析	第56-59页
5.5.1 对比算法	第56-57页
5.5.2 实验结果及分析	第57-59页
5.6 文本聚类算法类别数预测能力验证	第59-61页
5.7 本章小结	第61-62页
6 总结与展望	第62-64页
6.1 本文总结	第62-63页
6.2 研究展望	第63-64页
参考文献	第64-69页
作者简历及攻读硕士学位期间取得的研究成果	第69-71页
学位论文数据集	第71页