微博中话题的传播模型及热点预测
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-14页 |
1.1 本文研究的背景及意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-12页 |
1.2.1 微博内容过滤技术的研究现状 | 第10-11页 |
1.2.2 话题的传播分析及热点预测研究现状 | 第11-12页 |
1.3 本文的主要研究工作 | 第12页 |
1.4 论文的内容安排 | 第12-14页 |
第二章 微博数据的准备及预处理 | 第14-26页 |
2.1 微博数据的爬取 | 第14-16页 |
2.2 垃圾信息的过滤 | 第16-23页 |
2.2.1 微博特征 | 第16-18页 |
2.2.2 文本内容的向量化 | 第18-20页 |
2.2.3 过滤算法的实现 | 第20-22页 |
2.2.4 实验效果评估 | 第22-23页 |
2.3 微博话题的聚类 | 第23-25页 |
2.3.1 LDA模型建模 | 第23-24页 |
2.3.2 话题聚类 | 第24-25页 |
2.4 本章小结 | 第25-26页 |
第三章 话题的传播分析与分类模型 | 第26-48页 |
3.1 话题的传播分析 | 第26-40页 |
3.1.1 话题传播阶段的划分 | 第27-31页 |
3.1.2 话题传播中的用户分析 | 第31-36页 |
3.1.3 话题传播中的微博分析 | 第36-40页 |
3.2 分类模型 | 第40-47页 |
3.2.1 分类的思想 | 第40-41页 |
3.2.2 随机模型 | 第41页 |
3.2.3 类别检测 | 第41-45页 |
3.2.4 算法的实现 | 第45-47页 |
3.3 本章小结 | 第47-48页 |
第四章 话题的热点预测 | 第48-66页 |
4.1 话题趋势特征的构建 | 第48-54页 |
4.1.1 微博变化率 | 第48-49页 |
4.1.2 数据规范化 | 第49-51页 |
4.1.3 话题信号峰值处理 | 第51-53页 |
4.1.4 话题信号对数处理 | 第53-54页 |
4.2 在线话题距离的计算 | 第54-56页 |
4.3 实验结果及分析 | 第56-64页 |
4.3.1 算法的测试及参数分析 | 第57-60页 |
4.3.2 案例分析 | 第60-64页 |
4.4 本章小结 | 第64-66页 |
第五章 总结与展望 | 第66-68页 |
5.1 论文主要工作 | 第66-67页 |
5.2 工作展望 | 第67-68页 |
参考文献 | 第68-71页 |
致谢 | 第71-72页 |
攻读学位期间发表或已录用的学术论文 | 第72页 |