摘要 | 第6-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第11-19页 |
1.1 研究背景和意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-17页 |
1.2.1 国内研究现状 | 第12-14页 |
1.2.2 国外研究现状 | 第14-17页 |
1.3 研究内容和目标 | 第17页 |
1.4 论文结构安排 | 第17-19页 |
第2章 微博垃圾博主行为分析与相关检测技术 | 第19-28页 |
2.1 微博垃圾博主的行为分析 | 第19-20页 |
2.2 基于微博博文链接内容的微博推广联盟的检测 | 第20-22页 |
2.3 基于支持向量机的微博垃圾博主分类算法 | 第22-26页 |
2.3.1 支持向量机分类算法概述 | 第22-26页 |
2.3.2 支持向量机分类算法的优点与不足 | 第26页 |
2.4 本章小结 | 第26-28页 |
第3章 中文微博样本集与微博主题词库的构建 | 第28-42页 |
3.1 中文微博样本集的数据获取与存储 | 第28-34页 |
3.1.1 用户授权控制部分 | 第31-32页 |
3.1.2 数据获取部分 | 第32-33页 |
3.1.3 数据持久化部分 | 第33-34页 |
3.2 数据集预处理 | 第34-37页 |
3.3 基于主题生成模型的微博博文关键词数据样本集构建 | 第37-40页 |
3.3.1 微博博文主题生成 | 第37页 |
3.3.2 博文主题关键字选择 | 第37-40页 |
3.4 数据集标注 | 第40-41页 |
3.5 本章小结 | 第41-42页 |
第4章 垃圾微博用户特征分析与选择 | 第42-51页 |
4.1 特征选择与分析 | 第42-46页 |
4.1.1 用户行为特征分析与选择 | 第42-43页 |
4.1.2 用户个人资料特征特征分析与选择 | 第43页 |
4.1.3 用户微博内容特征分析与选择 | 第43-45页 |
4.1.4 用户关系特征分析与选择 | 第45-46页 |
4.2 实验对比 | 第46-50页 |
4.2.1 数据集平衡 | 第46-48页 |
4.2.2 分类性能评价标准 | 第48页 |
4.2.3 特征贡献与特征组合 | 第48-50页 |
4.3 本章小结 | 第50-51页 |
第5章 微博垃圾博主检测 | 第51-62页 |
5.1 基于多元分类支持向量机的多层次微博博主检测 | 第51-57页 |
5.1.1 多元支持向量机的主要实现方式 | 第51-54页 |
5.1.2 快速多元支持向量机分类算法 | 第54-55页 |
5.1.3 对比实验 | 第55-57页 |
5.2 基于综合权重的多层次微博垃圾博主检测算法 | 第57-61页 |
5.2.1 综合权重的计算 | 第57-60页 |
5.2.2 对比实验 | 第60-61页 |
5.3 本章小结 | 第61-62页 |
第6章 总结与展望 | 第62-64页 |
6.1 总结 | 第62页 |
6.2 展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-68页 |