第1章 概述 | 第1-11页 |
1.1 引言 | 第7-10页 |
1.1.1 Web服务的发展 | 第7-8页 |
1.1.2 数据挖掘技术 | 第8页 |
1.1.3 面向Web的数据挖掘 | 第8-9页 |
1.1.4 本文主题 | 第9-10页 |
1.2 本文内容和结构 | 第10-11页 |
第2章 面向Web日志挖掘的智能站点 | 第11-26页 |
2.1 数据挖掘和Web挖掘技术概述 | 第11-16页 |
2.1.1 KDD和数据挖掘 | 第11-12页 |
2.1.2 数据挖掘系统的分类 | 第12-13页 |
2.1.3 Web挖掘 | 第13-16页 |
2.2 Web日志挖掘概述 | 第16-22页 |
2.2.1 Web日志挖掘过程与任务 | 第16-18页 |
2.2.2 Web体系结构,术语解释以及Web跟踪机制 | 第18-22页 |
2.3 面向Web日志挖掘的智能站点体系结构 | 第22-26页 |
第3章 日志预处理技术及改进 | 第26-41页 |
3.1 Web日志挖掘中的预处理技术 | 第26-36页 |
3.1.1 数据挖掘的预处理技术 | 第26页 |
3.1.2 Web日志预处理技术 | 第26-34页 |
3.1.3 问题的出现 | 第34-36页 |
3.2 解决方法和算法 | 第36-39页 |
3.2.1 Frame页面过滤 | 第36-37页 |
3.2.2 算法实现 | 第37-39页 |
3.3 预处理改进算法的实验测试 | 第39-41页 |
第4章 一个快速有效的日志数据聚类算法 | 第41-50页 |
4.1 聚类技术概述 | 第41-44页 |
4.1.1 什么是聚类分析 | 第41-42页 |
4.1.2 Web日志中的聚类分析 | 第42-44页 |
4.2 SLIC算法实现及评测 | 第44-47页 |
4.2.1 SLIC算法的实现 | 第44-46页 |
4.2.2 SLIC算法的有效性实验 | 第46-47页 |
4.3 SLIC算法在Web日志挖掘中的应用实验 | 第47-50页 |
第5章 挖掘频繁访问页组的加强算法 | 第50-58页 |
5.1 问题的提出 | 第50-53页 |
5.1.1 什么是关联规则 | 第50-51页 |
5.1.2 Web日志中关联规则的兴趣性 | 第51-53页 |
5.2 Web日志中频繁访问页组挖掘的加强算法 | 第53-56页 |
5.2.1 范化内容链接比(NCLR) | 第53-54页 |
5.2.2 组内链接度(GILD) | 第54-55页 |
5.2.3 加强算法 | 第55-56页 |
5.3 加强算法的实验测试 | 第56-58页 |
第6章 实时智能推荐模块与管理员指导模块 | 第58-62页 |
6.1 实时智能推荐模块 | 第58-60页 |
6.1.1 实时智能推荐模块的接口 | 第58-60页 |
6.1.2 推荐形式 | 第60页 |
6.2 管理员指导模块 | 第60-62页 |
6.2.1 如何寻找站点设计的不合理之处 | 第60-61页 |
6.2.2 站点设计的改进 | 第61-62页 |
第7章 面向Web日志挖掘的智能站点原型实现 | 第62-71页 |
7.1 IWS的体系结构 | 第62-64页 |
7.1.1 Apache Web服务器 | 第62-63页 |
7.1.2 MySQL数据库服务器 | 第63页 |
7.1.3 IWS的体系结构 | 第63-64页 |
7.2 日志服务器的设计和预处理的实现 | 第64-66页 |
7.3 模式库、挖掘算法和推荐算法 | 第66-68页 |
7.3.1 频繁访问页组模式库 | 第66-67页 |
7.3.2 用户聚类模式库 | 第67-68页 |
7.4 IWS原型系统的实验 | 第68-71页 |
7.4.1 实验环境 | 第68-69页 |
7.4.2 响应时间 | 第69页 |
7.4.3 推荐效果 | 第69-70页 |
7.4.4 实验结论 | 第70-71页 |
第8章 总结与展望 | 第71-72页 |
8.1 论文所做的研究工作 | 第71页 |
8.2 进一步工作设想 | 第71-72页 |
参考文献 | 第72-74页 |
在读硕士期间发表的文章 | 第74-75页 |
致谢 | 第75页 |