基于云计算的微博舆情监控系统研究

摘要	第4-5页
Abstract	第5页
1 绪论	第8-14页
1.1 课题背景研究	第8-9页
1.2 国内外研究现状	第9-11页
1.2.1 国外话题发现研究现状	第10-11页
1.2.2 国内话题发现研究现状	第11页
1.3 课题主要内容	第11-12页
1.4 课题来源	第12-13页
1.5 论文章节安排	第13-14页
2 相关技术介绍	第14-26页
2.1 云计算技术	第14-19页
2.1.1 云计算的服务模式	第14-15页
2.1.2 典型的云计算平台	第15页
2.1.3 Apache Hadoop	第15-19页
2.2 舆情监控主要流程	第19-24页
2.2.1 文本模型建立	第20-21页
2.2.2 文本相似度计算	第21-22页
2.2.3 微博舆情监控分析	第22-24页
2.3 本章小结	第24-26页
3 基于微博短文本话题发现算法	第26-38页
3.1 微博文本分类	第27-29页
3.2 中文分词	第29-31页
3.2.1 数据预处理	第30页
3.2.2 新词发现	第30-31页
3.3 改进的LDA模型	第31-35页
3.3.1 微博文本的LDA建模	第32-34页
3.3.2 选取LDA超越参数	第34-35页
3.4 热点话题发现流程	第35-37页
3.4.1 LDA主题模型算法流程	第35-36页
3.4.2 基于LDA的主题聚类	第36-37页
3.5 本章小结	第37-38页
4 微博舆情监控系统的设计	第38-51页
4.1 数据采集模块	第38-41页
4.1.1 基于新浪API的数据采集	第39页
4.1.2 基于网络爬虫的数据采集	第39-41页
4.2 数据处理模块	第41-42页
4.2.1 去除无用符号	第41-42页
4.2.2 分词处理	第42页
4.2.3 去除停用词	第42页
4.2.4 文本模型	第42页
4.3 话题发现模块	第42-48页
4.3.1 K-means++ 算法实现	第43-47页
4.3.2 热点话题发现	第47-48页
4.4 舆情分析模块	第48-50页
4.4.1 热点话题传播路径	第48-49页
4.4.2 热点话题倾向性分析	第49-50页
4.4.3 热点话题社会网络分析	第50页
4.5 本章小结	第50-51页
5 实验结果分析	第51-61页
5.1 系统部署	第51-53页
5.1.1 集群系统结构	第51页
5.1.2 环境配置	第51-53页
5.2 微博数据采集	第53页
5.3 话题发现实验结果与分析	第53-60页
5.3.1 建立分类模型	第53-54页
5.3.2 中文分词	第54-55页
5.3.3 热点话题发现	第55-56页
5.3.4 舆情分析结果展示	第56-60页
5.4 本章小结	第60-61页
结论	第61-62页
致谢	第62-63页
参考文献	第63-68页
攻读学位期间发表的相关学术论文及研究成果	第68页