首页--文化、科学、教育、体育论文--信息与知识传播论文--信息与传播理论论文--传播理论论文

一种基于Hadoop的微博舆情监控系统模型研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-15页
第一章 绪论第15-25页
    1.1 研究背景及意义第15页
    1.2 国内外相关研究现状第15-24页
        1.2.1 大数据研究现状第15-23页
        1.2.2 微博舆情研究现状第23-24页
    1.3 本文的主要工作第24页
    1.4 论文的组织结构第24-25页
第二章 理论基础与相关技术第25-37页
    2.1 大数据相关理论和技术第25-29页
        2.1.1 大数据概念和特点第25-26页
        2.1.2 云计算平台-Hadoop第26-27页
        2.1.3 Hadoop MapReduce编程模型第27-28页
        2.1.4 Hadoop HDFS分布式文件系统第28-29页
    2.2 微博舆情相关理论第29-30页
        2.2.1 舆情的概念第29页
        2.2.2 微博舆情的特点第29-30页
    2.3 舆情信息预处理技术第30-35页
        2.3.1 中文分词第31-32页
        2.3.2 去除停用词第32-33页
        2.3.3 特征提取第33-35页
    2.4 舆情信息分析技术第35-36页
    2.5 本章小结第36-37页
第三章 微博舆情监控系统模型总体设计第37-45页
    3.1 模型概述第37-38页
    3.2 模型需求分析第38-39页
        3.2.1 功能性需求第38-39页
        3.2.2 非功能性需求第39页
    3.3 大数据环境下微博舆情监控系统模型构建第39-44页
        3.3.1 数据采集模块第40-43页
        3.3.2 数据预处理模块第43页
        3.3.3 舆情分析模块第43-44页
    3.4 本章小结第44-45页
第四章 微博舆情监控系统模型设计与实现第45-59页
    4.1 微博舆情监控系统功能各模块分析第45页
    4.2 微博数据采集模块关键技术第45-46页
    4.3 数据预处理模块第46-48页
        4.3.1 分布式预处理第47-48页
        4.3.2 特征抽取模块第48页
    4.4 数据聚类模块第48-54页
        4.4.1 聚类距离度量公式第49页
        4.4.2 K-Means聚类算法及其并行化第49-51页
        4.4.3 Canopy聚类算法及其并行化第51-53页
        4.4.4 利用HowNet提高文本聚类精度第53-54页
    4.5 微博舆情监控分析模块第54-58页
        4.5.1 热点话题发现第54-55页
        4.5.2 情感倾向性分析第55-58页
    4.6 本章小结第58-59页
第五章 实验及结果分析第59-65页
    5.1 实验环境配置第59-60页
    5.2 数据采集实验第60页
    5.3 文本预处理实验第60-62页
        5.3.1 中文分词实现倒排索引文件第60-61页
        5.3.2 文本向量化第61页
        5.3.3 实验结果分析第61-62页
    5.4 热点话题发现及可视化第62-63页
    5.5 情感倾向性分析第63-64页
    5.6 本章总结第64-65页
第六章 结论与展望第65-67页
    6.1 研究结论第65页
    6.2 研究展望第65-67页
参考文献第67-71页
致谢第71-73页
作者简介第73-74页

论文共74页,点击 下载论文
上一篇:基于全生命周期理论的多项目管理过程研究
下一篇:社交网络中社区发现算法研究