首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的微博用户影响力分析

摘要第8-9页
ABSTRACT第9-10页
第1章 绪论第11-23页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-15页
    1.3 相关技术第15-20页
    1.4 主要工作第20-21页
    1.5 论文组织结构第21-23页
第2章 系统概要设计第23-27页
    2.1 平台整体设计第23-24页
    2.2 数据采集模块第24页
    2.3 数据接入模块第24-25页
    2.4 数据分析模块第25-26页
        2.4.1 数据预处理第25页
        2.4.2 用户聚类第25-26页
    2.5 本章小结第26-27页
第3章 系统详细设计第27-37页
    3.1 数据采集模块第27-29页
        3.1.1 数据结构第27-28页
        3.1.2 采集器设计第28-29页
    3.2 数据接入模块第29-31页
        3.2.1 非关系型数据库的数据接入第29-30页
        3.2.2 关系型数据库的数据接入第30页
        3.2.3 文件系统的数据接入第30-31页
    3.3 数据分析模块第31-36页
        3.3.1 数据预处理第31-32页
        3.3.2 数据结构第32-34页
        3.3.3 用户影响力评价模型第34-35页
        3.3.4 用户聚类算法第35-36页
    3.4 本章小结第36-37页
第4章 系统实现第37-53页
    4.1 数据采集模块第37-42页
        4.1.1 Spider模块第37-40页
        4.1.2 IP代理模块第40-41页
        4.1.3 模拟登陆模块第41-42页
    4.2 数据接入模块第42-44页
    4.3 数据分析模块第44-51页
        4.3.1 生成基本表第44页
        4.3.2 表去重连接第44-46页
        4.3.3 合并相关表第46页
        4.3.4 实现聚类接口第46-51页
    4.4 本章小结第51-53页
第5章 环境部署第53-61页
    5.1 CM平台搭建第53-59页
        5.1.1 集群分配第53-54页
        5.1.2 离线部署准备第54-57页
        5.1.3 部署CM Server第57-58页
        5.1.4 分发CDH第58页
        5.1.5 部署CDH服务第58-59页
    5.2 本章小结第59-61页
第6章 总结和展望第61-62页
参考文献第62-64页
致谢第64-65页
附件第65页

论文共65页,点击 下载论文
上一篇:面向大规模跨模态检索的哈希方法研究
下一篇:基于情景信息质量管理的不确定性消除框架及算法的研究