首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于分布式存储数据库的银行用户行为分析平台应用与研究

摘要第4-5页
ABSTRACT第5页
1 绪论第8-12页
    1.1 研究工作的背景和意义第8页
    1.2 国内外研究现状第8-10页
        1.2.1 大数据研究及应用现状第8-9页
        1.2.2 用户行为研究的现状第9-10页
    1.3 本文的主要工作第10页
    1.4 本论文的结构安排第10-12页
2 相关技术基础第12-26页
    2.1 银行数据采集模块相关技术第12-14页
        2.1.1 数据采集技术第12页
        2.1.2 页面埋点技术第12-14页
    2.2 HADOOP云计算平台第14-21页
        2.2.1 HADOOP分布式文件系统HDFS第16-17页
        2.2.2 MAPREDUCE并行计算编程模型第17-19页
        2.2.3 HIVE分布式查询及分析技术第19-20页
        2.2.4 HBASE分布式存储数据库第20-21页
    2.3 日志采集与分析平台第21-23页
        2.3.1 金融系统的日志类型第21页
        2.3.2 FLUME技术介绍第21-22页
        2.3.3 STORM实时流式计算技术第22-23页
    2.4 Solr搜索引擎技术第23-24页
    2.5 数据可视化相关技术第24-25页
    2.6 本章小结第25-26页
3 银行大数据平台的分析与整体设计第26-33页
    3.1 系统需求分析第26页
    3.2 系统功能和模块设计第26-28页
        3.2.1 系统的功能设计第26-27页
        3.2.2 系统的模块设计第27-28页
    3.3 系统各模块的设计概要第28-31页
        3.3.1 数据采集模块第28-29页
        3.3.2 数据清洗模块第29页
        3.3.3 实时分析模块第29-30页
        3.3.4 离线分析模块第30页
        3.3.5 分布式存储模块第30-31页
        3.3.6 可视化模块设计概要第31页
    3.4 本章小结第31-33页
4 分布式存储数据库银行用户行为分析系统的实现第33-46页
    4.1 用户数据采集模块第33-35页
    4.2 数据清洗模块第35-36页
    4.3 Storm实时分析模块第36-38页
        4.3.1 搜索关键词分析第36-37页
        4.3.2 实时独立IP数统计第37页
        4.3.3 实时PV与UV的统计第37-38页
    4.4 HADOOP集群离线分析模块第38-41页
        4.4.1 用户全天在线时长分析第38-39页
        4.4.2 用户全天浏览深度分析第39页
        4.4.3 访客来源TOPN第39-40页
        4.4.4 页面停留时长TOPN第40-41页
    4.5 分布式存储模块第41-43页
        4.5.1 数据结构的设计与实现第41-42页
        4.5.2 Row Key设计与实现第42-43页
    4.6 可视化模块设计第43页
    4.7 银行用户行为分析平台各参数优化第43-44页
    4.8 本章小节第44-46页
5 总结与展望第46-48页
    5.1 工作总结第46-47页
    5.2 展望第47-48页
参考文献第48-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:信息系统集约化建设过程中安全管理机制研究与应用
下一篇:基于数据挖掘的校园卡消费数据分析及应用