摘要 | 第6-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第11-23页 |
1.1 选题来源及研究背景和意义 | 第11-12页 |
1.1.1 选题来源 | 第11页 |
1.1.2 研究背景和意义 | 第11-12页 |
1.2 国内外关于该选题的研究现状及分析 | 第12-20页 |
1.2.1 国内外研究现状 | 第12-16页 |
1.2.2 国内外文献综述简析 | 第16-20页 |
1.3 主要研究内容 | 第20-21页 |
1.3.1 研究内容 | 第20-21页 |
1.3.2 技术路线 | 第21页 |
1.4 研究方法和创新点 | 第21-23页 |
1.4.1 研究方法 | 第21-22页 |
1.4.2 创新点 | 第22-23页 |
第2章 相关基础理论与技术 | 第23-32页 |
2.1 社会网络理论 | 第23-26页 |
2.1.1 社会网络的定义 | 第23-24页 |
2.1.2 社会网络分析相关理论 | 第24-26页 |
2.2 数据采集技术 | 第26-28页 |
2.2.1 API接口采集 | 第26-27页 |
2.2.2 爬虫采集 | 第27-28页 |
2.3 数据预处理技术 | 第28-29页 |
2.3.1 分词技术 | 第28-29页 |
2.3.2 停用词技术 | 第29页 |
2.4 大数据技术 | 第29-31页 |
2.4.1 MapReduce子项目 | 第29-30页 |
2.4.2 HDFS子项目 | 第30-31页 |
2.5 本章小结 | 第31-32页 |
第3章 大数据与LDA融合微博信息推荐模型构建 | 第32-40页 |
3.1 大数据与LDA主题模型融合可行性分析 | 第32-33页 |
3.2 大数据与LDA融合微博信息推荐模型机理分析 | 第33页 |
3.3 微博信息采集 | 第33-35页 |
3.4 微博信息预处理 | 第35-37页 |
3.4.1 利用分词技术实现微博信息分词 | 第35页 |
3.4.2 利用去停用词技术实现微博信息去停用词 | 第35-36页 |
3.4.3 利用大数据技术实现微博信息初级过滤 | 第36-37页 |
3.5 微博文本信息主题提取与推荐 | 第37-39页 |
3.6 本章小结 | 第39-40页 |
第4章 实证分析与研究 | 第40-46页 |
4.1 实验环境 | 第40页 |
4.2 微博信息采集与处理 | 第40页 |
4.3 大数据技术对微博信息处理结果及效率分析 | 第40-44页 |
4.3.1 分布式节点对微博信息处理结果影响分析 | 第41-43页 |
4.3.2 微博信息量对微博信息处理结果影响分析 | 第43-44页 |
4.4 大数据与LDA融合推荐效果分析 | 第44-45页 |
4.5 本章小结 | 第45-46页 |
第5章 对策与建议 | 第46-51页 |
5.1 在微博信息推荐中提倡大数据与LDA的融合 | 第46页 |
5.2 在微博信息处理过程中因时而宜选择节点数 | 第46-47页 |
5.3 提高数据源规模来充分发挥大数据平台优势 | 第47-48页 |
5.4 在不同情景中选择不同LDA模型与大数据技术进行融合 | 第48页 |
5.5 在LDA与大数据融合中应提升主题数 | 第48-49页 |
5.6 微博原数据的前期清洗应适度控制 | 第49-50页 |
5.7 本章小结 | 第50-51页 |
结论 | 第51-52页 |
参考文献 | 第52-55页 |
攻读硕士学位期间发表的论文及其它成果 | 第55-56页 |
致谢 | 第56页 |