| 摘要 | 第1-5页 |
| Abstract | 第5-6页 |
| 目录 | 第6-8页 |
| 1 引言 | 第8-13页 |
| ·研究背景和意义 | 第8-9页 |
| ·研究背景 | 第8页 |
| ·研究意义 | 第8-9页 |
| ·微博用户研究的概述 | 第9-12页 |
| ·关于微博用户特征研究的概述 | 第9-11页 |
| ·关于聚类算法研究的概述 | 第11-12页 |
| ·本文的主要工作 | 第12页 |
| ·本文的结构安排 | 第12页 |
| ·本章小结 | 第12-13页 |
| 2 聚类分析的理论介绍 | 第13-20页 |
| ·聚类基本概念 | 第13-14页 |
| ·聚类的概述 | 第13页 |
| ·不同的聚类类型 | 第13-14页 |
| ·主要聚类算法 | 第14-17页 |
| ·基于划分的方法 | 第14-15页 |
| ·基于层次的方法 | 第15页 |
| ·基于模型的方法 | 第15-16页 |
| ·基于网格的方法 | 第16页 |
| ·基于密度的方法 | 第16-17页 |
| ·聚类的评价比较 | 第17-19页 |
| ·聚类过程评价 | 第17-18页 |
| ·聚类结果评价 | 第18-19页 |
| ·本章小结 | 第19-20页 |
| 3 数据分析的准备工作 | 第20-35页 |
| ·样本数据的收集 | 第20-21页 |
| ·样本数据的描述性统计分析 | 第21-34页 |
| ·离散型数据的描述性统计分析 | 第21-27页 |
| ·连续型数据的描述性统计分析 | 第27-31页 |
| ·所有数据的描述性统计分析 | 第31-34页 |
| ·本章小结 | 第34-35页 |
| 4 微博用户特征样本数据的聚类分析 | 第35-55页 |
| ·样本数据的预处理以及特点介绍 | 第35-36页 |
| ·样本数据的预处理 | 第35页 |
| ·样本数据的预处理 | 第35-36页 |
| ·基于划分的方法 | 第36-43页 |
| ·传统 K-Means 算法的在在实际应用中的不足 | 第36-37页 |
| ·改进后 K-Means 算法的理论介绍 | 第37-38页 |
| ·改进后 K-Means 算法的应用过程 | 第38-39页 |
| ·改进后 K-Means 算法的聚类结果 | 第39-43页 |
| ·基于层次的方法 | 第43-54页 |
| ·传统层次聚类算法在实际应用中的不足 | 第43-44页 |
| ·TwoSep 算法的理论介绍 | 第44-47页 |
| ·TwoStep 算法的应用过程 | 第47-50页 |
| ·Two-Sep 算法的聚类结果分析 | 第50-54页 |
| ·本章小结 | 第54-55页 |
| 5 聚类结果的评估 | 第55-60页 |
| ·聚类评价方法 | 第55页 |
| ·非监督的聚类评价方法 | 第55-57页 |
| ·Dunn 指数(The Dunn index) | 第55-56页 |
| ·轮廓指数(The Silhouette index) | 第56-57页 |
| ·Davies-Bouldin 指数(The Davies-Bouldin index) | 第57页 |
| ·对聚类评价方法的应用(具体计算过程,程序包说明) | 第57-58页 |
| ·对聚类评价结果的分析 | 第58页 |
| ·本章小结 | 第58-60页 |
| 6 总结与展望 | 第60-61页 |
| ·总结 | 第60页 |
| ·展望 | 第60-61页 |
| 参考文献 | 第61-63页 |
| 附录 | 第63-66页 |
| 致谢 | 第66-67页 |