首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于海量查询日志的数据挖掘及用户行为分析

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-16页
   ·课题研究背景第10-11页
   ·国内外研究现状第11-14页
     ·分布式技术研究现状第11-12页
     ·数据挖掘研究现状第12-13页
     ·Web日志挖掘研究现状第13-14页
   ·本文研究内容和意义第14-15页
   ·论文组织结构第15-16页
第二章 分布式技术和数据挖掘的研究第16-29页
   ·GFS第16-17页
     ·Google的分布式文件系统—GFS第16-17页
     ·GFS架构第17页
   ·Hadoop第17-22页
     ·HDFS第18-19页
     ·MapReduce编程框架第19-21页
     ·MapReduce执行流程第21-22页
   ·数据挖掘第22-25页
     ·数据挖掘的定义第23页
     ·数据挖掘的流程第23-24页
     ·数据挖掘的主要方法第24-25页
     ·数据挖掘的应用和挑战第25页
   ·Web日志挖掘第25-28页
     ·Web挖掘分类第25-27页
     ·Web日志挖掘流程第27-28页
   ·本章小结第28-29页
第三章 日志预处理技术第29-38页
   ·数据清洗第29-30页
   ·用户识别第30-31页
   ·会话识别第31-33页
   ·路径补充和事务识别第33-35页
   ·基于Hadoop的日志预处理实现第35-37页
   ·本章小结第37-38页
第四章 基于用户行为的查询日志挖掘第38-55页
   ·基于日志的用户聚类分析第38-39页
   ·日志挖据系统的设计第39-40页
   ·日志的数据挖掘第40-54页
     ·Mine模块的功能第40-41页
     ·基于日志的用户行为建模第41-42页
     ·基于MapReduce的关键词和URL聚类第42-44页
     ·用户的特征向量表示及相似度计算第44-46页
     ·K-means算法及其分布式实现第46-51页
     ·系统测试及结果分析第51-54页
   ·本章小结第54-55页
第五章 基于海量日志的用户行为分析第55-62页
   ·日志来源及用户搜索行为分析第55-56页
   ·日志量和用户量的分析第56-57页
   ·用户查询词的分析第57-59页
     ·查询词的数量分析第57-58页
     ·查询词的字符分析第58-59页
     ·查询词的长度分析第59页
   ·用户点击URL的分析第59-60页
   ·URL rank与用户点击顺序的分析第60-61页
   ·本章小结第61-62页
第六章 总结和展望第62-64页
   ·本文主要工作第62页
   ·未来工作第62-64页
参考文献第64-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:基于统计知识的文本情感倾向研究
下一篇:模糊图像感知质量评价算法研究