WEB日志挖掘及其应用研究
论文摘要 | 第1-7页 |
ABSTRACT | 第7-11页 |
第一章 引言 | 第11-22页 |
·数据挖掘的起源 | 第11页 |
·数据挖掘的概况 | 第11-13页 |
·数据挖掘的定义 | 第11页 |
·数据挖掘过程简介 | 第11-12页 |
·关联规则 | 第12-13页 |
·Web数据挖掘 | 第13-19页 |
·Web数据挖掘的由来 | 第14-15页 |
·Web数据挖掘的特点 | 第15页 |
·Web数据挖掘的目标 | 第15-16页 |
·Web挖掘任务分类 | 第16-18页 |
·Web数据挖掘的难点 | 第18-19页 |
·本文工作与章节组织 | 第19-22页 |
第二章 Web使用信息挖掘研究背景 | 第22-35页 |
·国内外WEB日志挖掘的研究动态 | 第22-23页 |
·数据预处理 | 第23-31页 |
·WEB日志数据源 | 第24-25页 |
·数据净化和字段扩充 | 第25-27页 |
·用户识别 | 第27-28页 |
·会话识别 | 第28-29页 |
·基于XML的网站结构 | 第29-30页 |
·路径填充 | 第30-31页 |
·模式发现及应用 | 第31-35页 |
·关于Web个性化 | 第32页 |
·关于网站结构优化 | 第32-33页 |
·商业智能的实现 | 第33页 |
·关于隐私问题 | 第33-35页 |
第三章 通用访问路径发现模型 | 第35-44页 |
·访问模式分析 | 第35-36页 |
·真实路径获取算法 | 第36-38页 |
·前向访问路径截取算法TEAP | 第38-39页 |
·UPD上通用访问路径模式的挖掘 | 第39-43页 |
·本章小结 | 第43-44页 |
第四章 隐式页面关联规则发现模型 | 第44-56页 |
·数据净化 | 第46页 |
·用户识别与会话识别 | 第46-47页 |
·访问过程中目标页的确定 | 第47-49页 |
·页面关联规则发现算法TPARD | 第49-55页 |
·关联规则理论原理 | 第49-51页 |
·目标页面关联规则发现算法 | 第51-55页 |
·本章小结 | 第55-56页 |
第五章 站点结构调整模型 | 第56-64页 |
·引言 | 第56-57页 |
·访问模式分析 | 第57-58页 |
·真实路径获取及回溯点的确定 | 第58-59页 |
·网站物理结构的调整和再组织 | 第59-62页 |
·本章小结 | 第62-64页 |
第六章 频繁遍历主干子网发现模型 | 第64-71页 |
·会话识别 | 第64-65页 |
·用户访问路径会话集发现算法 | 第65-67页 |
·加权网站结构图生成算法 | 第67-69页 |
·频繁遍历主干子网的发现 | 第69页 |
·实验分析 | 第69-71页 |
第七章 个性化搜素引擎模型的发现 | 第71-80页 |
·引言 | 第71-72页 |
·个性化Web搜索 | 第72页 |
·会话识别与单用户搜索关键字会话集发现算法 | 第72-74页 |
·单用户搜索关键字关联规则发现算法 | 第74-78页 |
·本章小结 | 第78-80页 |
第八章 隐私保护关联规则挖掘方法 | 第80-91页 |
·引言 | 第81页 |
·会话识别 | 第81-83页 |
·事务数据库的布尔矩阵表示 | 第83-84页 |
·结合列置换的伪列随机化回答方法 | 第84-86页 |
·基于位逻辑与操作的高效频繁项集生成算法 | 第86-88页 |
·实验结果分析 | 第88-89页 |
·本章小结 | 第89-91页 |
第九章 上海社区服务网数据仓库的设计与实现 | 第91-105页 |
·基本概念概述 | 第92页 |
·关于数据仓库 | 第92-93页 |
·“维表-事实表”构成的关系型数据仓库模式 | 第93-95页 |
·关于OLAP | 第95-97页 |
·上海社区服务网后台数据仓库的实现 | 第97-104页 |
·本章小结 | 第104-105页 |
第十章.结论与展望 | 第105-108页 |
·本文主要贡献与创新 | 第105-106页 |
·进一步的研究工作 | 第106-108页 |
附录一 数据仓库维表字段说明 | 第108-110页 |
附录二 数据仓库事实表字段说明 | 第110-111页 |
参考文献 | 第111-118页 |
博士学位期间参加的科研项目和发表的学术论文 | 第118-119页 |
致谢 | 第119页 |