WEB使用挖掘系统数据预处理子系统的设计
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 引言 | 第9-22页 |
·课题背景与课题任务 | 第9-10页 |
·数据挖掘概述 | 第10-13页 |
·数据挖掘的概念 | 第10-11页 |
·数据挖掘的过程 | 第11页 |
·数据挖掘的功能 | 第11-12页 |
·数据挖掘常用的技术 | 第12-13页 |
·数据仓库与数据挖掘 | 第13-18页 |
·数据仓库概念及特点 | 第13-15页 |
·数据仓库数据模型设计 | 第15-16页 |
·数据仓库与数据挖掘 | 第16-18页 |
·WEB挖掘与数据挖掘 | 第18-20页 |
·WEB挖掘概述 | 第18页 |
·WEB挖掘分类及国内外现状与发展 | 第18-20页 |
·项目中任务以及论文结构 | 第20-22页 |
·我在项目中的任务 | 第20页 |
·论文结构 | 第20-22页 |
第二章 WEB使用挖掘系统总体设计 | 第22-28页 |
·WEB使用挖掘分类 | 第22-23页 |
·WEB使用挖掘过程模型 | 第23页 |
·系统功能模块介绍 | 第23-28页 |
·数据采集 | 第23-24页 |
·ETL处理 | 第24-25页 |
·模式发现 | 第25-26页 |
·模式分析 | 第26-27页 |
·部署应用 | 第27-28页 |
第三章 数据预处理子系统的设计 | 第28-33页 |
·数据预处理面临的难度和挑战 | 第28-29页 |
·数据预处理相关名词 | 第29-31页 |
·数据预处理服务器部署设计 | 第31-32页 |
·数据预处理过程设计 | 第32-33页 |
第四章 数据采集设计 | 第33-47页 |
·数据采集分类 | 第33-37页 |
·基于WEB服务器日志的数据采集 | 第34-35页 |
·基于浏览器交互数据的客户端采集 | 第35-37页 |
·TDC数据采集总体设计 | 第37-40页 |
·TDC数据采集过程 | 第37-39页 |
·TDC数据采集设计要点 | 第39-40页 |
·COOKIES ID服务器设计 | 第40-41页 |
·TDC接收服务器设计 | 第41-43页 |
·接收服务器TDC设计 | 第41-42页 |
·接收服务器TDC数据处理过程 | 第42-43页 |
·新业务TDC部署设计 | 第43-47页 |
·新业务TDC部署过程 | 第43页 |
·使WEB站点适合点击流 | 第43-44页 |
·嵌入JS代码 | 第44-46页 |
·JS文件分发 | 第46页 |
·TDC配置 | 第46-47页 |
第五章 点击流数据仓库设计 | 第47-59页 |
·维度建模的一些基本术语 | 第47页 |
·点击流数据仓库的设计方法 | 第47-48页 |
·点击流数据仓库粒度模型设计 | 第48-49页 |
·点击流数据仓库元模型设计 | 第49-52页 |
·点击流数据仓库表设计 | 第52-59页 |
·点击流仓库维表 | 第52-57页 |
·点击流数据仓库事实表 | 第57-59页 |
第六章 ETL处理过程设计 | 第59-68页 |
·ETL总体设计 | 第59-61页 |
·统一调度与监控 | 第61-68页 |
·ETL调度ER图 | 第61-63页 |
·ETL过程调度配置表 | 第63-65页 |
·ETL调度处理过程 | 第65-68页 |
第七章 总结与展望 | 第68-70页 |
·论文工作总结 | 第68页 |
·问题和展望 | 第68-70页 |
参考文献 | 第70-71页 |
致谢 | 第71-72页 |
附录1:客户端嵌入的标准JS代码 | 第72-83页 |