首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop改进聚类算法在Web日志聚类中的应用

摘要第4-5页
Abstract第5页
1 绪论第8-19页
    1.1 研究背景和研究目标第8-10页
        1.1.1 研究背景第8-9页
        1.1.2 研究目标和意义第9-10页
    1.2 国内外研究现状第10-15页
        1.2.1 Hadoop分布式研究现状第10-11页
        1.2.2 Web日志聚类研究现状第11-15页
    1.3 研究内容和组织结构第15-19页
2 Hadoop分布式平台和Web日志聚类技术研究第19-31页
    2.1 Hadoop分布式系统研究第19-22页
        2.1.1 HDFS第19-20页
        2.1.2 MapReduce第20-22页
        2.1.3 HBase第22页
    2.2 Web日志聚类技术研究第22-30页
        2.2.1 Web日志预处理第23-25页
        2.2.2 PSO-KMeans算法第25-29页
        2.2.3 FCM算法第29-30页
    2.3 本章小结第30-31页
3 PSO-KMeans算法和FCM算法优化第31-46页
    3.1 PSO-KMeans算法优化第31-34页
        3.1.1 模拟退火机制和轮盘赌策略第31-32页
        3.1.2 基于模拟退火机制和轮盘赌策略的PSO-KMeans算法第32-34页
    3.2 FCM算法优化第34-44页
        3.2.1 基于BAS改进FCM算法第34-41页
        3.2.2 基于布谷鸟算法优化FCM算法第41-44页
    3.3 算法选择第44页
    3.4 本章小结第44-46页
4 基于Hadoop的Web日志聚类系统研究与实现第46-57页
    4.1 基于Hadoop的Web日志预处理模块设计与实现第47-51页
        4.1.1 日志清洗第47-48页
        4.1.2 初次用户识别第48-49页
        4.1.3 会话识别第49-50页
        4.1.4 最终用户识别第50-51页
    4.2 基于Hadoop的Web日志聚类实现第51-55页
        4.2.1 Web日志建模第51-52页
        4.2.2 基于Hadoop的PSO-KMeans算法在Web日志聚类中的应用第52-53页
        4.2.3 基于Hadoop的BAS-FCM算法在Web日志聚类中的应用第53-55页
    4.3 基于MapReduce的HBase数据库存储聚类结果第55页
    4.4 本章小结第55-57页
5 实验及数据分析第57-68页
    5.1 环境搭建第57-58页
        5.1.1 硬件环境第57页
        5.1.2 软件环境第57页
        5.1.3 系统设计第57-58页
    5.2 实验分析第58-67页
        5.2.1 算法准确率和稳定性实验第58-60页
        5.2.2 算法效率实验第60-64页
        5.2.3 基于Hadoop的Web日志聚类结果第64-66页
        5.2.4 结果分析第66-67页
    5.3 本章小结第67-68页
6 总结与展望第68-70页
    6.1 总结第68-69页
    6.2 展望第69-70页
致谢第70-71页
参考文献第71-76页

论文共76页,点击 下载论文
上一篇:单光子雪崩光电二极管的部分关键技术研究
下一篇:基于作业运行特征的大数据处理系统性能优化研究