聚类分析中最佳聚类数确定方法研究

摘要	第4-5页
abstract	第5页
专用术语注释表	第8-10页
第一章绪论	第10-15页
1.1 研究背景及其意义	第10-11页
1.2 研究现状综述	第11-12页
1.3 主要创新与章节安排	第12-15页
1.3.1 创新点	第13页
1.3.2 章节安排	第13-15页
第二章相关背景知识介绍	第15-22页
2.1 聚类分析概述	第15-17页
2.2 聚类有效性评价	第17-20页
2.2.1 外部有效性指标	第18-19页
2.2.2 内部有效性指标	第19-20页
2.3 最佳聚类数确定方法	第20-21页
2.4 本章小结	第21-22页
第三章基于泛化能力的K-means最佳聚类数确定方法	第22-34页
3.1 引言	第22-23页
3.2 相关知识	第23-25页
3.2.1 K-means聚类算法	第23-24页
3.2.2 泛化能力	第24-25页
3.3 基于泛化能力的聚类有效性指标	第25-28页
3.3.1 GA指标及相关概念定义	第25-27页
3.3.2 GA指标分析	第27-28页
3.4 基于GA指标的K-means最佳聚类数确定方法	第28-29页
3.5 仿真实验与数据	第29-33页
3.5.1 人工数据集	第29-31页
3.5.2 真实数据集	第31-32页
3.5.3 聚类有效性指标对比实验	第32-33页
3.6 本章小结	第33-34页
第四章基于改进的K-means算法的中文文本聚类	第34-53页
4.1 引言	第34页
4.2 相关知识	第34-39页
4.2.1 文本自动分词	第35-36页
4.2.2 特征提取	第36-37页
4.2.3 文本相似度计算	第37-39页
4.3 中文新闻文本聚类框架设计	第39-40页
4.4 数据准备	第40-41页
4.5 基于改进K-means算法的新闻聚类	第41-52页
4.5.1 开发环境部署	第41-42页
4.5.2 文本预处理	第42-48页
4.5.3 文本聚类	第48-52页
4.6 本章小结	第52-53页
第五章总结与展望	第53-55页
5.1 本文工作总结	第53页
5.2 今后研究方向	第53-55页
参考文献	第55-57页
附录 1 攻读硕士学位期间撰写的论文	第57-58页
附录 2 程序清单	第58-59页
致谢	第59页