首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网访问数据预处理研究与应用--基于Hadoop

摘要第1-7页
ABSTRACT第7-11页
第一章 绪论第11-16页
   ·选题背景第11-12页
   ·研究意义第12-13页
   ·相关研究现状第13-14页
   ·本文的工作第14-15页
   ·本文的组织结构第15-16页
第二章 Web日志挖掘和Web日志预处理第16-24页
   ·Web日志挖掘第16-19页
     ·Web日志挖掘概述第16页
     ·Web日志挖掘的数据源第16-17页
     ·Web日志挖掘的过程第17-19页
   ·Web日志预处理第19-23页
     ·数据清理第19-20页
     ·会话识别第20页
     ·用户识别第20-21页
     ·自然语言处理第21-23页
   ·本章小结第23-24页
第三章 Hadoop平台概述第24-34页
   ·Hadoop平台背景第24-27页
     ·云计算概述第24页
     ·Google云计算平台介绍第24-25页
     ·Hadoop平台的产生第25-26页
     ·Hadoop的master/slave架构第26-27页
   ·Hadoop分布式文件系统HDFS第27-31页
     ·HDFS的结构第28-29页
     ·HDFS的工作流程第29-30页
     ·HDFS的特点第30-31页
   ·Hadoop的MapReduce计算构架第31-33页
     ·一般的MapReduce模型第31页
     ·Hadoop MapReduce的实现第31-33页
     ·Hadoop MapReduce的特点第33页
   ·本章小结第33-34页
第四章 预处理在Hadoop中的分析设计第34-45页
   ·Web日志预处理流程设计第34页
   ·数据清理第34-35页
   ·用户识别设计第35-42页
     ·会话识别第37-39页
     ·Cookie提取第39-41页
     ·会话合并第41-42页
     ·用户标记第42页
   ·关键词提取设计第42-44页
     ·搜索内容提取第42-43页
     ·关键词提取第43-44页
   ·本章小结第44-45页
第五章 预处理在Hadoop中的实现第45-56页
   ·运行环境配置第45-47页
     ·运行平台搭建第45页
     ·Hadoop环境配置第45-47页
   ·Hadoop实现第47-54页
     ·代码框架第47-49页
     ·用户识别实现第49-53页
     ·关键词提取实现第53-54页
   ·实验结果第54-55页
     ·实验数据第54页
     ·实验结果第54-55页
   ·本章小结第55-56页
第六章 总结与展望第56-58页
   ·全文总结第56-57页
   ·研究展望第57-58页
参考文献第58-61页
攻读硕士学位期间发表的学术论文和参与的项目第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于OPC的信息融合研究与应用
下一篇:复杂场景中运动目标的检测