微博恶意用户识别方法的研究

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7页
1 引言	第11-19页
1.1 研究背景	第11-14页
1.2 国内外研究现状	第14-17页
1.2.1 恶意用户识别技术	第14-15页
1.2.2 机器学习在恶意用户识别中的应用	第15页
1.2.3 随机森林算法	第15-16页
1.2.4 Hadoop平台	第16-17页
1.3 提出问题	第17页
1.4 论文主要内容	第17-19页
2 相关技术	第19-27页
2.1 微博	第19-22页
2.1.1 微博及其特征	第19页
2.1.2 微博信息传播特点	第19-22页
2.2 爬虫技术	第22-24页
2.2.1 网络爬虫	第22-23页
2.2.2 微博爬虫	第23-24页
2.3 机器学习	第24-25页
2.4 Hadoop平台	第25-26页
2.5 本章小结	第26-27页
3 微博恶意用户识别技术	第27-53页
3.1 数据获取	第27-31页
3.1.1 微博爬虫样本获取	第27-31页
3.1.2 购买粉丝样本获取	第31页
3.2 恶意用户特征分析	第31-38页
3.3 恶意用户识别算法	第38-44页
3.3.1 朴素贝叶斯算法	第38-39页
3.3.2 决策树	第39-42页
3.3.3 随机森林算法	第42-44页
3.4 实验设计与结果分析	第44-52页
3.4.1 构建测试数据集	第44-45页
3.4.2 模型评价	第45-46页
3.4.3 设计与实现	第46-50页
3.4.4 结果与分析	第50-52页
3.5 本章小结	第52-53页
4 基于Hadoop平台的微博恶意用户识别算法	第53-63页
4.1 引言	第53页
4.2 Hadoop平台	第53-58页
4.2.1 Hadoop架构	第53-54页
4.2.2 HDFS分布式文件系统	第54-56页
4.2.3 MapReduce编程模型	第56-58页
4.3 实验分析	第58-62页
4.3.1 实验准备	第58页
4.3.2 评价指标	第58页
4.3.3 结果与分析	第58-62页
4.4 本章小结	第62-63页
5 总结与展望	第63-65页
参考文献	第65-67页
作者简历及攻读硕士学位期间取得的研究成果	第67-69页
学位论文数据集	第69页