基于两种改进的聚类算法对新浪微博用户信息的研究

摘要	第1-5页
Abstract	第5-6页
目录	第6-8页
1 引言	第8-13页
·研究背景和意义	第8-9页
·研究背景	第8页
·研究意义	第8-9页
·微博用户研究的概述	第9-12页
·关于微博用户特征研究的概述	第9-11页
·关于聚类算法研究的概述	第11-12页
·本文的主要工作	第12页
·本文的结构安排	第12页
·本章小结	第12-13页
2 聚类分析的理论介绍	第13-20页
·聚类基本概念	第13-14页
·聚类的概述	第13页
·不同的聚类类型	第13-14页
·主要聚类算法	第14-17页
·基于划分的方法	第14-15页
·基于层次的方法	第15页
·基于模型的方法	第15-16页
·基于网格的方法	第16页
·基于密度的方法	第16-17页
·聚类的评价比较	第17-19页
·聚类过程评价	第17-18页
·聚类结果评价	第18-19页
·本章小结	第19-20页
3 数据分析的准备工作	第20-35页
·样本数据的收集	第20-21页
·样本数据的描述性统计分析	第21-34页
·离散型数据的描述性统计分析	第21-27页
·连续型数据的描述性统计分析	第27-31页
·所有数据的描述性统计分析	第31-34页
·本章小结	第34-35页
4 微博用户特征样本数据的聚类分析	第35-55页
·样本数据的预处理以及特点介绍	第35-36页
·样本数据的预处理	第35页
·样本数据的预处理	第35-36页
·基于划分的方法	第36-43页
·传统 K-Means 算法的在在实际应用中的不足	第36-37页
·改进后 K-Means 算法的理论介绍	第37-38页
·改进后 K-Means 算法的应用过程	第38-39页
·改进后 K-Means 算法的聚类结果	第39-43页
·基于层次的方法	第43-54页
·传统层次聚类算法在实际应用中的不足	第43-44页
·TwoSep 算法的理论介绍	第44-47页
·TwoStep 算法的应用过程	第47-50页
·Two-Sep 算法的聚类结果分析	第50-54页
·本章小结	第54-55页
5 聚类结果的评估	第55-60页
·聚类评价方法	第55页
·非监督的聚类评价方法	第55-57页
·Dunn 指数（The Dunn index）	第55-56页
·轮廓指数（The Silhouette index）	第56-57页
·Davies-Bouldin 指数（The Davies-Bouldin index）	第57页
·对聚类评价方法的应用（具体计算过程，程序包说明）	第57-58页
·对聚类评价结果的分析	第58页
·本章小结	第58-60页
6 总结与展望	第60-61页
·总结	第60页
·展望	第60-61页
参考文献	第61-63页
附录	第63-66页
致谢	第66-67页