摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第13-21页 |
1.1 研究背景及意义 | 第13-14页 |
1.1.1 研究背景 | 第13-14页 |
1.1.2 研究意义 | 第14页 |
1.2 国内外研究现状 | 第14-18页 |
1.2.1 Hadoop调度器优化现状 | 第14-16页 |
1.2.2 舆情分析研究现状 | 第16-18页 |
1.3 课题研究内容 | 第18-19页 |
1.4 本文组织结构 | 第19-21页 |
第二章 Hadoop相关技术理论 | 第21-29页 |
2.1 Hadoop集群服务器角色 | 第21-22页 |
2.2 Hadoop分布式文件系统(HDFS) | 第22-23页 |
2.3 MapReduce作业执行概况 | 第23-24页 |
2.4 Hadoop常用调度器算法 | 第24-25页 |
2.5 Hadoop网络拓扑 | 第25-26页 |
2.6 Hadoop生态体系 | 第26页 |
2.7 本章小结 | 第26-29页 |
第三章 基于取样评估的最小传输代价Reduce任务调度器 | 第29-39页 |
3.1 问题描述 | 第29-31页 |
3.2 ARS取样算法 | 第31-32页 |
3.3 传输代价数学模型 | 第32-33页 |
3.4 MTCRS的调度过程 | 第33-34页 |
3.5 实验与评估 | 第34-38页 |
3.5.1 实验环境和数据集 | 第34页 |
3.5.2 实验结果与分析 | 第34-38页 |
3.6 本章小结 | 第38-39页 |
第四章 基于互信息和KMeans聚类的混合舆情分析方法 | 第39-49页 |
4.1 话题发现 | 第39-42页 |
4.1.1 特征提取 | 第39-40页 |
4.1.2 主题聚类 | 第40-42页 |
4.1.3 热词提取 | 第42页 |
4.2 情感分析 | 第42-43页 |
4.2.1 情感打分 | 第42-43页 |
4.2.2 趋势分析 | 第43页 |
4.3 实验与评估 | 第43-47页 |
4.3.1 实验环境和数据集 | 第43-44页 |
4.3.2 实验结果及分析 | 第44-47页 |
4.4 本章小结 | 第47-49页 |
第五章 基于Hadoop优化平台的新闻舆情分析系统的设计与实现 | 第49-65页 |
5.1 系统整体架构 | 第49-51页 |
5.2 新闻数据采集模块的设计与实现 | 第51-54页 |
5.3 话题发现模块的设计与实现 | 第54-61页 |
5.3.1 数据预处理 | 第55-58页 |
5.3.2 话题聚类 | 第58-60页 |
5.3.3 热词提取 | 第60-61页 |
5.4 情感分析模块的设计与实现 | 第61-63页 |
5.5 本章小结 | 第63-65页 |
第六章 总结与展望 | 第65-67页 |
6.1 总结 | 第65-66页 |
6.2 展望 | 第66-67页 |
参考文献 | 第67-71页 |
致谢 | 第71-73页 |
研究成果及发表的学术论文 | 第73-75页 |
作者与导师简介 | 第75-76页 |
附件 | 第76-77页 |