首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于互联网访问日志的用户特征分析研究

摘要第1-7页
ABSTRACT第7-11页
第一章 绪论第11-17页
   ·课题的研究背景第11-12页
   ·用户特征分析的国内外研究现状第12-14页
     ·国外研究状况第13页
     ·国内研究状况第13-14页
   ·本文的主要研究内容第14-15页
   ·本文的组织结构第15-16页
   ·本章小结第16-17页
第二章 相关技术研究第17-29页
   ·WEB挖掘概述第17-23页
     ·WEB挖掘的概念及特点第17-18页
     ·WEB挖掘分类第18-22页
     ·WEB日志挖掘的主要方法第22-23页
   ·Hadoop相关技术第23-28页
     ·Hadoop第23-26页
     ·Hive第26-27页
     ·Mahout第27-28页
   ·本章小结第28-29页
第三章 基于MapReduce的用户特征项提取第29-39页
   ·互联网访问日志预处理第29-30页
     ·访问日志清洗第29页
     ·用户识别第29-30页
     ·网页内容抓取与清洗第30页
   ·用户特征项相关介绍第30-32页
     ·文本的特征项第30-32页
     ·用户的特征项第32页
   ·基于MapReduce的用户特征项提取算法设计第32-38页
   ·本章小结第38-39页
第四章 基于Hadoop平台的相似特征用户挖掘第39-46页
   ·文本聚类简介第39-41页
     ·常用的文本聚类算法第39-40页
     ·K-means聚类第40-41页
   ·相似特征用户挖掘算法第41-45页
     ·用户特征相似性度量第41-42页
     ·基于Hadoop平台的相似特征用户挖掘算法设计第42-45页
   ·本章小结第45-46页
第五章 用户特征分析系统设计与实现第46-60页
   ·系统整体架构第46-47页
   ·日志预处理模块详细设计与实现第47-54页
     ·互联网访问日志采集第47-48页
     ·访问日志数据清洗第48-49页
     ·用户识别第49-54页
   ·文档预处理模块详细设计与实现第54-55页
     ·网页抓取与清洗第54-55页
     ·文本分词第55页
   ·用户特征分析模块设计与实现第55-59页
     ·用户特征分析模块整体架构第56页
     ·基于MapReduce的用户特征提取算法的实现第56-59页
   ·本章小结第59-60页
第六章 总结与展望第60-62页
   ·总结第60-61页
   ·展望第61-62页
参考文献第62-66页
攻读学位期间的研究成果目录第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:产品评论的有效评价句提取及自动分类技术的研究
下一篇:基于Streambase的量化交易平台的设计与实现