首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于路径与页面挖掘的用户浏览行为研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-13页
    1.1 研究背景第9-10页
    1.2 目的和意义第10页
    1.3 国内外的研究现状和问题难点第10-11页
        1.3.1 国内外的研究现状第10-11页
        1.3.2 存在的问题和难点第11页
    1.4 本文的研究内容和章节安排第11-13页
        1.4.1 本文的研究内容第11-12页
        1.4.2 本文的章节安排第12-13页
第二章 平台概述及研究框架第13-22页
    2.1 概述第13-14页
    2.2 Hadoop平台第14-17页
        2.2.1 HDFS文件系统第14-15页
        2.2.2 MapReduce引擎第15-16页
        2.2.3 Hadoop工作流程第16-17页
    2.3 Hive数据仓库第17-19页
        2.3.1 数据仓库概述第17-19页
        2.3.2 Hadoop下的Hive子项目第19页
    2.4 用户浏览行为研究框架第19-21页
        2.4.1 用户浏览行为研究的四层框架第19-21页
        2.4.2 用户浏览行为挖掘与分析的内容第21页
    2.5 本章小结第21-22页
第三章 数据处理与浏览行为主题建设第22-32页
    3.1 ETL过程第22-26页
        3.1.1 ETL概述第22-24页
        3.1.2 日志提取第24-25页
        3.1.3 流量清洗第25页
        3.1.4 格式转换第25页
        3.1.5 数据加载入库第25-26页
    3.2 页面归类与会话识别第26-29页
        3.2.1 主站页面归类第26-27页
        3.2.2 会话识别第27-29页
    3.3 浏览行为主题建设第29-31页
        3.3.1 构建数据集市第29-30页
        3.3.2 浏览主题数据集市构建算法第30-31页
    3.4 本章小结第31-32页
第四章 基于数据仓库的频繁访问路径挖掘第32-43页
    4.1 关联规则算法概述第32-36页
        4.1.1 概述第32-33页
        4.1.2 Apriori算法第33-34页
        4.1.3 FP-Growth算法第34-35页
        4.1.4 基于CA矩阵的RCFA路径挖掘算法第35-36页
    4.2 改进的路径挖掘算法第36-38页
        4.2.1 基于数据仓库的路径挖掘改进第36-37页
        4.2.2 Hive-CFAP算法描述第37-38页
    4.3 实例分析第38-42页
        4.3.1 关联规则算法实例第39-40页
        4.3.2 RCFA算法实例第40-41页
        4.3.3 Hive-CFAP算法实例第41-42页
    4.4 本章小结第42-43页
第五章 用户浏览行为研究第43-51页
    5.1 概述第43-44页
    5.2 数据仓库报表层及其分析展现第44-45页
    5.3 用户浏览行为研究第45-50页
        5.3.1 用户频繁访问路径挖掘及其应用第45-47页
        5.3.2 用户浏览距离分析第47-48页
        5.3.3 基于矩阵的相似浏览用户聚类第48-50页
    5.4 本章小结第50-51页
第六章 总结与展望第51-53页
    6.1 全文总结第51页
    6.2 未来展望第51-53页
参考文献第53-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:订阅分发平台过滤性能的优化
下一篇:10G EPON ONU中五元组业务识别等模块的FPGA设计与实现