首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop/MongoDB的Web日志挖掘技术研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第12-19页
    1.1 研究背景与意义第12-14页
    1.2 国内外研究现状第14-17页
        1.2.1 Web日志挖掘国内外研究现状第14-16页
        1.2.2 云计算国内外研究现状第16-17页
    1.3 本文的研究内容及章节安排第17-19页
第2章 Web日志挖掘基本理论第19-27页
    2.1 WEB日志文件结构第19-20页
    2.2 日志文件的位置第20-21页
        2.2.1 Web服务器日志第20-21页
        2.2.2 Web代理服务器日志第21页
        2.2.3 客户端浏览器日志第21页
    2.3 WEB服务器日志类型第21-23页
        2.3.1 Error日志第22页
        2.3.2 Access日志第22-23页
    2.4 WEB日志的预处理第23-26页
        2.4.1 数据清洗第23-24页
        2.4.2 用户和会话识别第24-25页
        2.4.3 数据转换第25页
        2.4.4 路径补充第25-26页
    2.5 小结第26-27页
第3章 Hadoop基本框架与MongoDB第27-36页
    3.1 MAPREDUCE编程模型第27-28页
    3.2 HADOOP基本框架介绍第28-32页
        3.2.1 Hadoop的来源第28-29页
        3.2.2 Hadoop基本框架第29-30页
        3.2.3 Hadoop的MapReduce框架第30-32页
        3.2.4 Hadoop的性有能第32页
    3.3 MONGODB第32-35页
        3.3.1 传统的关系数据库的缺陷第32-33页
        3.3.2 NoSQL数据库第33-34页
        3.3.3 MongoDB第34页
        3.3.4 MongoDB的性能第34-35页
    3.4 小结第35-36页
第4章 基于Hadoop/MongoDB的Web日志挖掘算法第36-45页
    4.1 关联规则第36-38页
    4.2 关联规则的分类第38页
    4.3 关联规则挖掘算法研究第38-41页
        4.3.1 Apriori算法第38-40页
        4.3.2 其它关联规则挖掘算法第40-41页
    4.4 基于HADOOP/MONGODB的WEB日志挖掘算法第41-44页
        4.4.1 算法的提出第41-42页
        4.4.2 算法的基本思想第42-43页
        4.4.3 算法在Hadoop和MongoDB上的实现第43-44页
    4.5 小结第44-45页
第5章 ApriorHM算法实现第45-53页
    5.1 系统总体设计方案第45-46页
    5.2 算法输入数据的收集第46页
    5.3 WEB日志的预处理第46-50页
    5.4 挖掘算法的实现第50-52页
    5.5 小结第52-53页
第6章 AprioriHM算法的验证第53-60页
    6.1 实验环境第53-55页
        6.1.1 Hadoop集群的搭建和配置第53-55页
        6.1.2 MongoDB的配置第55页
    6.2 实验过程第55-56页
        6.2.1 对原始数据小文件的处理第56页
        6.2.2 算法运行过程第56页
    6.3 实验结果分析第56-59页
        6.3.1 AprioriHM算法与Apriori算法的比较第56-58页
        6.3.2 AprioriHM算法可扩充性第58-59页
    6.4 小结第59-60页
结论第60-62页
参考文献第62-66页
致谢第66-67页
附录A 攻读学位期间所发表的学术论文列表第67页

论文共67页,点击 下载论文
上一篇:高校思想政治理论课考核体系建设研究
下一篇:基于稀疏表示的手势识别算法研究