首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

分布式数据挖掘在网站日志分析中的开发与应用

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-12页
    1.1 选题背景及意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本文的主要工作第11-12页
第二章 Hadoop平台原理与数据挖掘第12-19页
    2.1 Hadoop的整体架构第12-13页
    2.2 HDFS分布式存储第13-14页
        2.2.1 HDFS体系结构第13-14页
        2.2.2 HDFS工作流程第14页
    2.3 MapReduce分布式计算第14-16页
        2.3.1 MapReduce体系结构第14-15页
        2.3.2 MapReduce工作流程第15-16页
    2.4 数据挖掘简介第16-19页
        2.4.1 数据挖掘流程第16-17页
        2.4.2 数据挖掘算法第17-19页
第三章 Web日志预处理第19-29页
    3.1 Web挖掘与Web日志第19-21页
    3.2 Web日志预处理阶段第21-29页
        3.2.1 数据清洗第22-23页
        3.2.2 用户识别第23-25页
        3.2.3 会话识别及其改进第25-29页
第四章 DBSCAN和DBDC聚类算法及其改进第29-38页
    4.1 DBSCAN算法第29-32页
    4.2 改进的DBDC算法D-DBDC第32-38页
        4.2.1 局部聚类阶段的改进第33-37页
        4.2.2 Web日志挖掘中局部调整算法第37-38页
第五章 关联规则FP-Growth算法及其改进第38-56页
    5.1 Apriori算法第38-39页
    5.2 FP-Growth算法第39-41页
    5.3 基于聚类动态决策的分布式D-FP-Growth算法第41-56页
        5.3.1 基于水平分割的分布式FP-Growth算法第41-47页
        5.3.2 基于垂直分割的分布式FP-Growth算法第47-50页
        5.3.3 基于聚类动态决策的分布式D-FP-Growth算法及其平衡策略第50-56页
第六章 基于聚类的平衡的D-FP-Growth算法在Web日志中的应用实现与分析第56-66页
    6.1 系统环境与整体结构第56-57页
    6.2 数据预处理实现与分析第57-59页
    6.3 聚类功能实现与算法分析第59-62页
    6.4 频繁模式挖掘功能实现与算法分析第62-64页
    6.5 挖掘结果分析第64-66页
第七章 总结与展望第66-68页
    7.1 总结第66-67页
    7.2 展望第67-68页
参考文献第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:声誉对网店绩效的影响研究--基于关系质量的调节作用
下一篇:高职院校与企业合作培养人才的长效机制研究