一种基于Hadoop的微博舆情监控系统模型研究

摘要	第5-6页
ABSTRACT	第6-7页
符号对照表	第10-11页
缩略语对照表	第11-15页
第一章绪论	第15-25页
1.1 研究背景及意义	第15页
1.2 国内外相关研究现状	第15-24页
1.2.1 大数据研究现状	第15-23页
1.2.2 微博舆情研究现状	第23-24页
1.3 本文的主要工作	第24页
1.4 论文的组织结构	第24-25页
第二章理论基础与相关技术	第25-37页
2.1 大数据相关理论和技术	第25-29页
2.1.1 大数据概念和特点	第25-26页
2.1.2 云计算平台-Hadoop	第26-27页
2.1.3 Hadoop MapReduce编程模型	第27-28页
2.1.4 Hadoop HDFS分布式文件系统	第28-29页
2.2 微博舆情相关理论	第29-30页
2.2.1 舆情的概念	第29页
2.2.2 微博舆情的特点	第29-30页
2.3 舆情信息预处理技术	第30-35页
2.3.1 中文分词	第31-32页
2.3.2 去除停用词	第32-33页
2.3.3 特征提取	第33-35页
2.4 舆情信息分析技术	第35-36页
2.5 本章小结	第36-37页
第三章微博舆情监控系统模型总体设计	第37-45页
3.1 模型概述	第37-38页
3.2 模型需求分析	第38-39页
3.2.1 功能性需求	第38-39页
3.2.2 非功能性需求	第39页
3.3 大数据环境下微博舆情监控系统模型构建	第39-44页
3.3.1 数据采集模块	第40-43页
3.3.2 数据预处理模块	第43页
3.3.3 舆情分析模块	第43-44页
3.4 本章小结	第44-45页
第四章微博舆情监控系统模型设计与实现	第45-59页
4.1 微博舆情监控系统功能各模块分析	第45页
4.2 微博数据采集模块关键技术	第45-46页
4.3 数据预处理模块	第46-48页
4.3.1 分布式预处理	第47-48页
4.3.2 特征抽取模块	第48页
4.4 数据聚类模块	第48-54页
4.4.1 聚类距离度量公式	第49页
4.4.2 K-Means聚类算法及其并行化	第49-51页
4.4.3 Canopy聚类算法及其并行化	第51-53页
4.4.4 利用HowNet提高文本聚类精度	第53-54页
4.5 微博舆情监控分析模块	第54-58页
4.5.1 热点话题发现	第54-55页
4.5.2 情感倾向性分析	第55-58页
4.6 本章小结	第58-59页
第五章实验及结果分析	第59-65页
5.1 实验环境配置	第59-60页
5.2 数据采集实验	第60页
5.3 文本预处理实验	第60-62页
5.3.1 中文分词实现倒排索引文件	第60-61页
5.3.2 文本向量化	第61页
5.3.3 实验结果分析	第61-62页
5.4 热点话题发现及可视化	第62-63页
5.5 情感倾向性分析	第63-64页
5.6 本章总结	第64-65页
第六章结论与展望	第65-67页
6.1 研究结论	第65页
6.2 研究展望	第65-67页
参考文献	第67-71页
致谢	第71-73页
作者简介	第73-74页