首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于大数据的微博社交网络舆情分析与研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 选题背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 国外研究现状第11-12页
        1.2.2 国内研究现状第12-14页
    1.3 论文的研究内容第14页
    1.4 论文的组织结构第14-16页
第二章 相关理论研究第16-33页
    2.1 大数据处理平台及技术第16-23页
        2.1.1 Hadoop平台第16-17页
        2.1.2 分布式文件存储系统HDFS第17-18页
        2.1.3 分布式处理系统MapReduce第18-20页
        2.1.4 资源管理系统YARN第20-21页
        2.1.5 Hadoop生态系统第21-23页
    2.2 微博社交网络舆情分析技术第23-31页
        2.2.1 微博数据采集技术第24-27页
        2.2.2 微博信息的预处理技术第27-29页
        2.2.3 文本聚类分析技术第29-30页
        2.2.4 微博舆情分析技术第30-31页
    2.3 本章小节第31-33页
第三章 基于Hadoop的微博舆情分析的并行化研究第33-41页
    3.1 文本分布式预处理第33-35页
    3.2 特征选择的分布式计算第35-36页
    3.3 Mahout向量化计算第36-38页
    3.4 Mahout聚类算法第38-40页
    3.5 本章小节第40-41页
第四章 基于MapReduce的K-means聚类算法的实现与改进第41-49页
    4.1 K-means算法思想第41页
    4.2 K-means算法步骤第41-43页
    4.3 基于MapReduce的K-means算法的并行化研究第43-45页
    4.4 基于MapReduce的K-means算法的改进与优化第45-47页
        4.4.1 MapReduce算法的优化第45-46页
        4.4.2 基于MapReduce算法的改进第46-47页
    4.5 本章小节第47-49页
第五章 实验与分析第49-61页
    5.1 实验环境与配置第49-53页
        5.1.1 实验环境第49-50页
        5.1.2 Hadoop平台的搭建第50-52页
        5.1.3 Mahout的安装和配置第52-53页
    5.2 实验数据与评价指标第53-54页
        5.2.1 实验数据第53页
        5.2.2 聚类算法的评价指标第53-54页
    5.3 数据预处理第54-55页
    5.4 测试结果与分析第55-60页
        5.4.1 聚类质量的比较第55-57页
            5.4.1.1 最大簇间距离和最小簇内距离第55-56页
            5.4.1.2 算法的召回率、准确率和F值第56-57页
            5.4.1.3 算法执行时间第57页
        5.4.2 算法串行和并行比较第57-58页
            5.4.2.1 算法的执行时间分析第57-58页
            5.4.2.2 算法的加速比分析第58页
        5.4.3 热点生成第58-60页
        5.4.4 正负情感分析第60页
    5.5 本章小结第60-61页
第六章 展望与总结第61-63页
    6.1 论文总结第61页
    6.2 研究展望第61-63页
参考文献第63-67页
攻读硕士学位期间取得的研究成果第67-69页
致谢第69-70页

论文共70页,点击 下载论文
上一篇:面向移栽过程的组培苗识别技术研究
下一篇:基于移动终端的音乐节视觉形象设计研究