首页--经济论文--贸易经济论文--国内贸易经济论文--商品流通与市场论文--市场论文--商业心理学、市场心理学论文

基于大数据的网络用户行为分析

摘要第4-5页
Abstract第5-6页
1 绪论第10-16页
    1.1 研究背景及意义第10-12页
        1.1.1 社会背景第10-11页
        1.1.2 技术背景第11页
        1.1.3 研究意义第11-12页
    1.2 研究现状第12-13页
    1.3 论文创新点第13页
    1.4 论文组织结构第13-14页
    1.5 本章小结第14-16页
2 大数据分析平台第16-30页
    2.1 概述第16页
    2.2 分布式文件系统第16-17页
    2.3 Hadoop技术介绍第17-22页
        2.3.1 Hadoop系统框架第17-18页
        2.3.2 Hadoop运行机制第18-19页
        2.3.3 MapReduce编程框架第19-20页
        2.3.4 HDFS分布式文件系统第20-21页
        2.3.5 HBase数据库第21-22页
    2.4 文本聚类相关技术第22-29页
        2.4.1 Web文本聚类概念第22页
        2.4.2 Web文本聚类过程第22-23页
        2.4.3 Web文本聚类技术第23-28页
        2.4.4 文本聚类实现流程第28-29页
    2.5 本章小结第29-30页
3 系统的需求与概要设计第30-36页
    3.1 需求分析第30-31页
        3.1.1 系统业务需求第30页
        3.1.2 功能需求分析第30-31页
    3.2 系统功能设计第31-34页
        3.2.1 数据预处理模块第32-33页
        3.2.2 数据转存模块第33页
        3.2.3 数据分析模块第33-34页
    3.3 系统总体架构设计第34-35页
        3.3.1 Hadoop集群层第34页
        3.3.2 HDFS存储层第34-35页
        3.3.3 MapReduce计算层第35页
        3.3.4 业务逻辑层第35页
    3.4 本章小结第35-36页
4 系统详细设计第36-56页
    4.1 日志概述第36-37页
        4.1.1 搜索引擎日志的产生第36-37页
        4.1.2 搜索引擎日志持类型第37页
    4.2 日志数据预处理具体实现第37-41页
        4.2.1 查询关键词分词处理第38-40页
        4.2.2 文本特征向量提取第40-41页
    4.3 数据存储具体实现第41-45页
        4.3.1 设计目标第41页
        4.3.2 HBase数据表设计第41-43页
        4.3.3 转存模块类第43-45页
    4.4 数据分析模块具体实现第45-54页
        4.4.1 用户搜索关键字排行分析第45-48页
        4.4.2 用户点击URL排行分析第48-49页
        4.4.3 相关关键字分析第49-52页
        4.4.4 用户查询主题聚类第52-54页
    4.5 本章小结第54-56页
5 环境部署与实现第56-68页
    5.1 系统环境说明第56页
        5.1.1 软硬件环境说明第56页
        5.1.2 集群网络环境第56页
    5.2 系统环境搭建第56-63页
        5.2.1 配置本地环境第57页
        5.2.2 设置SSH无密码互联环境第57-58页
        5.2.3 配置Hadoop第58-63页
    5.3 实验与结果分析第63-67页
        5.3.1 用户查询关键字频度排名第63页
        5.3.2 查询主题聚类分析第63-64页
        5.3.3 URL排行分析第64-65页
        5.3.4 URL排名与用户点击分析第65-66页
        5.3.5 用户访问时间段分布第66-67页
    5.4 本章小结第67-68页
6 总结与展望第68-70页
参考文献第70-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于神经网络学习模型的视频目标跟踪研究
下一篇:量子图像压缩制备与信息隐藏