致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
1 引言 | 第12-18页 |
1.1 研究背景与意义 | 第12-13页 |
1.2 国内外研究总结 | 第13-14页 |
1.3 论文主要工作及结构 | 第14-18页 |
1.3.1 研究思路 | 第14-15页 |
1.3.2 论文结构 | 第15-18页 |
2 相关技术综述 | 第18-26页 |
2.1 文本处理技术 | 第18-20页 |
2.1.1 汉语分词 | 第18-19页 |
2.1.2 分词工具 | 第19页 |
2.1.3 相似度计算 | 第19-20页 |
2.2 TF-IDF算法 | 第20-21页 |
2.3 LDA主题模型 | 第21页 |
2.4 PageRank算法 | 第21-23页 |
2.5 神经网络 | 第23-24页 |
2.6 本章小结 | 第24-26页 |
3 微博兴趣特征提取 | 第26-44页 |
3.1 微博内容介绍 | 第26-27页 |
3.2 微博数据采集 | 第27-30页 |
3.2.1 新浪API | 第27-28页 |
3.2.2 使用OAuth2.0调用API | 第28-29页 |
3.2.3 数据存储 | 第29-30页 |
3.3 短文本微博内容兴趣特征提取 | 第30-33页 |
3.3.1 短文本TF-IDF算法 | 第30-32页 |
3.3.2 LDA模型的微博兴趣特征提取 | 第32-33页 |
3.3.3 LDA模型的吉布斯抽样算法 | 第33页 |
3.4 短文本微博内容兴趣特征提取实现 | 第33-43页 |
3.4.1 改进TF-IDF兴趣特征提取方案实现 | 第33-36页 |
3.4.2 LDA模型微博内容兴趣特征提取方案实现 | 第36-41页 |
3.4.3 实验方案评价 | 第41-43页 |
3.5 本章小结 | 第43-44页 |
4 基于兴趣的微博用户影响力排名研究 | 第44-60页 |
4.1 基于PageRank的微博用户影响力算法 | 第44-46页 |
4.1.1 算法原理 | 第44-45页 |
4.1.2 算法内容 | 第45-46页 |
4.2 基于兴趣的用户影响力模型 | 第46-49页 |
4.2.1 微博用户兴趣特征提取 | 第46-47页 |
4.2.2 特定兴趣下微博用户影响力测量 | 第47-48页 |
4.2.3 流行率分析 | 第48-49页 |
4.2.4 特定兴趣下微博用户综合影响力计算 | 第49页 |
4.3 算法实现验证结果与分析 | 第49-58页 |
4.3.1 经典算法实现及结果 | 第49-52页 |
4.3.2 特定兴趣下微博用户影响力测量实现及结果 | 第52-56页 |
4.3.3 实验结果比较分析 | 第56-58页 |
4.4 本章小结 | 第58-60页 |
5 基于兴趣和影响力的微博转发预测算法及实现 | 第60-80页 |
5.1 微博转发预测定义 | 第60-61页 |
5.2 BPNN预测模型 | 第61-67页 |
5.2.1 BPNN学习过程 | 第61-65页 |
5.2.2 BP神经网络结构与参数设计 | 第65-67页 |
5.3 BPNN预测算法实现 | 第67-70页 |
5.3.1 BPNN网络初始化 | 第67页 |
5.3.2 BPNN网络训练 | 第67-68页 |
5.3.3 BPNN训练与预测 | 第68-70页 |
5.4 基于兴趣和影响力的微博转发预测实验 | 第70-78页 |
5.4.1 微博用户兴趣和影响力计算 | 第70-73页 |
5.4.2 预测实验内容 | 第73-76页 |
5.4.3 预测模型实验有效性分析 | 第76-78页 |
5.5 实验结论 | 第78-79页 |
5.6 本章小结 | 第79-80页 |
6 论文总结 | 第80-82页 |
参考文献 | 第82-86页 |
作者简历及攻读硕士/博士学位期间取得的研究成果 | 第86-90页 |
学位论文数据集 | 第90页 |