社交网络中的数据挖掘与分析

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-14页
1.1 课题研究的背景、目的和意义	第9-10页
1.2 国内外技术研究概况	第10页
1.3 数据挖掘简介	第10-11页
1.4 数据挖掘功能	第11-12页
1.5 本论文的主要研究内容及结构安排	第12-14页
第2章微博短文本分析和处理技术	第14-26页
2.1 微博的特点	第14-15页
2.2 微博短文本的文本分析	第15-21页
2.2.1 文本数据预处理技术	第15-18页
2.2.2 短文本文本表示方法VSM基础	第18-20页
2.2.3 相似度衡量	第20-21页
2.3 话题发现的经典聚类算法	第21-25页
2.3.1 single-pass算法	第21-22页
2.3.2 K-means算法	第22-23页
2.3.3 BIRCH算法	第23-25页
2.4 本章小结	第25-26页
第3章微博数据集的获取	第26-33页
3.1 爬虫简介	第26页
3.2 爬虫原理	第26-29页
3.2.1 爬虫的基本框架	第26-27页
3.2.2 爬虫的搜索策略	第27-29页
3.3 爬虫获取微博数据	第29-31页
3.3.1 注册中国爬盟账号	第29-30页
3.3.2 下载中国爬盟软件	第30-31页
3.4 运用新浪微博API数据获取	第31-32页
3.5 本章小结	第32-33页
第4章微博短文本的处理和话题发现	第33-54页
4.1 引言	第33页
4.2 短文本特征扩展	第33-39页
4.2.1 创建特征共现集	第34-35页
4.2.2 特征扩展算法描述	第35页
4.2.3 语义分析方法	第35-37页
4.2.4 实验和结果分析	第37-39页
4.3 话题发现流程	第39-40页
4.4 话题发现技术	第40-53页
4.4.1 文本聚类算法及比较	第40-43页
4.4.2 改进的增量聚类算法	第43-47页
4.4.3 实验和结果分析	第47-53页
4.5 本章小结	第53-54页
结论	第54-56页
参考文献	第56-60页
攻读硕士学位期间所发表的学术论文	第60-61页
致谢	第61页