基于Hadoop的微博舆情分析

摘要	第4-5页
abstract	第5页
第一章绪论	第8-13页
1.1 研究背景及意义	第8-9页
1.2 国内外研究现状	第9-11页
1.3 研究内容	第11-12页
1.4 本文的组织结构	第12-13页
第二章 Hadoop平台相关技术研究	第13-18页
2.1 Hadoop历史和框架	第13页
2.2 并行编程模型MapReduce	第13-15页
2.2.1 MapReduce工作流程	第14-15页
2.3 分布式文件系统HDFS	第15-17页
2.3.1 HDFS写流程	第16页
2.3.2 HDFS读流程	第16-17页
2.4 本章小结	第17-18页
第三章微博话题发现相关技术	第18-27页
3.1 引言	第18页
3.2 相关工作	第18-19页
3.3 微博的特点	第19页
3.3.1 微博短文本的特性	第19页
3.4 经典聚类算法	第19-24页
3.4.1 K-means聚类算法	第20-22页
3.4.2 FuzzyC-means算法	第22页
3.4.3 Canopy聚类算法	第22-24页
3.5 文本相似度的度量	第24-26页
3.5.1 距离判定	第24-25页
3.5.2 文本相似系数的判定	第25-26页
3.6 本章小结	第26-27页
第四章微博用户网络舆情分析	第27-37页
4.1 数据准备	第27-28页
4.2 数据预处理	第28-30页
4.3 数据聚类	第30-32页
4.3.1 LatentDirichletAllocation模型	第30-31页
4.3.2 LKC聚类算法的实现过程	第31-32页
4.4 舆情分析	第32-36页
4.4.1 情感倾向分析	第32-35页
4.4.2 敏感话题检测	第35-36页
4.5 本章小结	第36-37页
第五章实验与结果验证	第37-43页
5.1 实验环境	第37页
5.2 Hadoop集群配置与部署	第37-39页
5.2.1 Hadoop集群搭建过程	第37-39页
5.3 改进算法验证与分析	第39-42页
5.3.1 实验设计	第39-42页
5.4 本章小结	第42-43页
第六章总结与展望	第43-45页
6.1 总结	第43页
6.2 展望	第43-45页
参考文献	第45-47页
发表论文和科研情况说明	第47-48页
致谢	第48页