基于Web日志的用户访问序列模式挖掘研究

摘要	第4-5页
Abstract	第5-6页
第一章前言	第10-15页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-13页
1.2.1 国外研究现状	第11-12页
1.2.2 国内研究现状	第12-13页
1.3 主要研究内容	第13页
1.4 论文章节安排	第13-15页
第二章 Web日志的预处理与分析	第15-40页
2.1 Web日志挖掘概述	第15-19页
2.1.1 Web挖掘分类及比较	第15-17页
2.1.2 Web日志挖掘过程	第17-19页
2.1.3 常用Web日志挖掘系统	第19页
2.1.4 Web日志挖掘研究方向	第19页
2.2 Web日志介绍	第19-22页
2.2.1 Web日志形成	第19-20页
2.2.2 Web日志的数据格式	第20-21页
2.2.3 Web日志原始存储数据库设计	第21-22页
2.3 Web日志的预处理	第22-31页
2.3.1 Web日志预处理过程	第22-23页
2.3.2 数据清洗(Data Cleaning)	第23-24页
2.3.3 用户识别(User Identification)	第24-26页
2.3.4 会话识别(Session Identification)	第26-29页
2.3.5 路径补充(Path Supplement)	第29-30页
2.3.6 事务识别(Transaction Identifiction)	第30-31页
2.4 预处理结果存储数据库设计	第31-33页
2.5 预处理实例分析与结果展示	第33-39页
2.6 本章小结	第39-40页
第三章用户访问序列模式及挖掘算法研究	第40-53页
3.1 序列模式	第40-43页
3.1.1 序列模式介绍	第40页
3.1.2 序列模式的基本术语	第40-41页
3.1.3 基于Web日志的用户访问序列模式	第41-42页
3.1.4 用户访问序列模式实例分析	第42-43页
3.2 序列模式挖掘	第43-47页
3.2.1 序列模式挖掘介绍	第43页
3.2.2 经典序列模式挖掘算法分析与比较	第43-47页
3.3 PrefixSpan算法的研究与分析	第47-51页
3.3.1 PrefixSpan算法相关术语	第47-48页
3.3.2 PrefixSpan算法具体流程	第48-49页
3.3.3 PrefixSpan算法实例分析	第49-51页
3.4 本章小结	第51-53页
第四章论文的关键问题研究	第53-67页
4.1 Web日志会话识别的研究与分析	第53-57页
4.1.1 问题的提出	第53页
4.1.2 会话识别改进思路	第53-54页
4.1.3 会话识别改进方法	第54-57页
4.2 框架页面过滤	第57-64页
4.2.1 问题的提出	第57-59页
4.2.2 添加框架页面过滤的日志预处理	第59-60页
4.2.3 Frame过滤算法及实例分析	第60-64页
4.3 PrefixSpan算法的研究与改进	第64-65页
4.3.1 问题的提出	第64页
4.3.2 基于PrefixSpan算法的改进思路	第64-65页
4.3.3 改进PrefixSpan算法的实现	第65页
4.4 本章小结	第65-67页
第五章实验验证与分析	第67-72页
5.1 系统环境及开发平台	第67页
5.2 实验结果验证及分析	第67-71页
5.2.1 会话识别改进方法验证	第67-68页
5.2.2 PrefixSpan改进算法验证	第68-71页
5.3 本章小结	第71-72页
结论	第72-74页
参考文献	第74-78页
致谢	第78页