基于簇特征的文本增量聚类研究

摘要	第3-4页
Abstract	第4-5页
目录	第6-8页
1 引言	第8-12页
1.1 研究背景及研究意义	第8-10页
1.2 本文工作	第10页
1.3 论文组织	第10-12页
2 文本挖掘及文本聚类概述	第12-24页
2.1 文本挖掘概述	第12-13页
2.1.1 文本挖掘步骤	第12-13页
2.1.2 文本挖掘任务	第13页
2.2 文本结构化表示	第13-19页
2.2.1 文本预处理	第14-15页
2.2.2 文本特征	第15-17页
2.2.3 文本表示	第17-19页
2.3 文本聚类概述	第19-23页
2.3.1 文本聚类定义	第19页
2.3.2 常用文本聚类算法	第19-22页
2.3.3 文本聚类算法的评价指标	第22-23页
2.4 本章小结	第23-24页
3 基于簇特征的文本增量聚类算法	第24-32页
3.1 相关研究工作	第24-27页
3.1.1 文本非增量聚类（传统文本聚类）	第24-25页
3.1.2 文本增量聚类	第25-27页
3.2 基于簇特征的文本增量聚类算法	第27-30页
3.2.1 初始聚类阶段	第27-29页
3.2.2 增量聚类阶段	第29-30页
3.3 算法与分析	第30-31页
3.4 本章小结	第31-32页
4 实验设计及结果分析	第32-47页
4.1 实验准备	第32-33页
4.1.1 数据集	第32页
4.1.2 数据预处理	第32-33页
4.2 实验设计	第33页
4.3 评价指标	第33-36页
4.3.1 纯度（Purity）	第34-35页
4.3.2 熵（Entropy）	第35页
4.3.3 归一化互信息（Normalized Mutual Information，NMI）	第35-36页
4.4 实验结果及分析	第36-46页
4.4.1 随机抽取的 10 个类别的结果分析	第37-38页
4.4.2 全部 20 个类别的结果分析	第38-39页
4.4.3 权重因子对实验结果的影响	第39-42页
4.4.4 实验中 3 个判断条件对结果的影响	第42-45页
4.4.5 与 SHC 的比较	第45-46页
4.5 本章小结	第46-47页
5 总结与展望	第47-49页
5.1 总结	第47页
5.2 未来工作	第47-49页
参考文献	第49-54页
简历	第54-55页
致谢	第55页