摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-14页 |
§1.1 问题提出 | 第10页 |
§1.2 研究概况 | 第10-12页 |
§1.3 本文主要研究工作 | 第12-13页 |
§1.4 论文章节安排 | 第13-14页 |
第2章 Web使用挖掘概述 | 第14-22页 |
§2.1 数据收集 | 第14-15页 |
§2.2 数据预处理 | 第15-20页 |
§2.2.1 数据清理 | 第16-17页 |
§2.2.2 用户识别 | 第17-19页 |
§2.2.3 会话识别 | 第19页 |
§2.2.4 路径完善 | 第19-20页 |
§2.3 模式发现和模式分析 | 第20-21页 |
§2.4 小结 | 第21-22页 |
第3章 序列模式挖掘算法 | 第22-43页 |
§3.1 序列模式挖掘定义 | 第22-25页 |
§3.1.1 问题模型 | 第22页 |
§3.1.2 子序列和超序列 | 第22-23页 |
§3.1.3 序列的支持度和频繁序列 | 第23页 |
§3.1.4 序列模式和序列模式挖掘 | 第23-25页 |
§3.2 经典序列模式挖掘算法 | 第25-42页 |
§3.2.1 AprioriAll算法 | 第26-30页 |
§3.2.2 SPADE算法 | 第30-35页 |
§3.2.3 SPAM算法 | 第35-38页 |
§3.2.4 PrefixSpan算法 | 第38-42页 |
§3.3 小结 | 第42-43页 |
第4章 Web日志访问序列模式挖掘 | 第43-54页 |
§4.1 Web日志挖掘的预处理 | 第43页 |
§4.2 Web日志访问序列模式 | 第43-45页 |
§4.2.1 问题模型 | 第43-44页 |
§4.2.2 子序列和超序列 | 第44页 |
§4.2.3 支持度和频繁序列 | 第44页 |
§4.2.4 访问序列模式挖掘 | 第44页 |
§4.2.5 前缀、投影与后缀 | 第44-45页 |
§4.3 Web日志访问序列模式挖掘算法SPAM-FPT | 第45-53页 |
§4.3.1 构造FPT(FIRST_POSITION_TABLE) | 第45-48页 |
§4.3.2 SPAM-FPT算法总体思想 | 第48-49页 |
§4.3.3 在FPT上挖掘Web日志访问序列模式 | 第49-53页 |
§4.4 小结 | 第53-54页 |
第5章 系统FPT-Miner的实现与性能评测 | 第54-61页 |
§5.1 系统环境 | 第54页 |
§5.2 系统功能模块划分与实现 | 第54-57页 |
§5.2.1 系统功能模块的划分 | 第54-55页 |
§5.2.2 Web日志访问序列模式挖掘模块数据结构描述 | 第55-57页 |
§5.3 性能评测 | 第57-60页 |
§5.4 小结 | 第60-61页 |
第6章 全文总结和展望 | 第61-63页 |
§6.1 内容总结 | 第61-62页 |
§6.2 研究展望 | 第62-63页 |
附录 (攻读学位期间发表的论文) | 第63-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-67页 |