中文摘要 | 第1-4页 |
Abstract | 第4-8页 |
第一章 引言 | 第8-13页 |
·论文的研究背景及意义 | 第8-9页 |
·国内外与Web日志挖掘相关的研究现状 | 第9-11页 |
·国外研究现状 | 第9-10页 |
·国内主要研究成果 | 第10-11页 |
·Web日志挖掘相关产品 | 第11页 |
·本文的特色与创新之处 | 第11页 |
·论文的组织结构 | 第11-13页 |
第二章 预处理算法的研究与改进 | 第13-28页 |
·Web日志 | 第13-15页 |
·数据预处理相关算法研究 | 第15-23页 |
·数据清理 | 第15-16页 |
·页面识别 | 第16-17页 |
·用户识别 | 第17-18页 |
·会话识别 | 第18-19页 |
·事务识别 | 第19-20页 |
·数据预处理过程举例 | 第20-23页 |
·数据预处理算法的改进 | 第23-28页 |
·关于“页面特性” | 第23-24页 |
·基于“页面特性”的数据预处理算法 | 第24-28页 |
第三章 系统相关数据挖掘算法的研究及改进 | 第28-41页 |
·关联分析 | 第28-36页 |
·关联分析概述 | 第28-29页 |
·Apriori算法 | 第29-30页 |
·Apriori算法的改进 | 第30-33页 |
·Apriori算法与Trans_Apriori算法之间的效率对比 | 第33-36页 |
·聚类分析 | 第36-41页 |
·聚类分析概述 | 第36-37页 |
·本系统中的聚类分析 | 第37页 |
·改进的用户-页面特性访问矩阵 | 第37-39页 |
·K-Means聚类算法 | 第39-41页 |
第四章 网站日志分析系统的设计与实现 | 第41-64页 |
·网站日志分析系统的概要设计 | 第41-46页 |
·网站日志分析系统的主要功能模块 | 第41-43页 |
·网站日志分析系统的数据库设计 | 第43-44页 |
·网站日志分析系统的工作流程 | 第44-46页 |
·网站日志分析系统主要模块的详细设计与实现 | 第46-64页 |
·数据库连接相关模块 | 第46页 |
·数据导入模块 | 第46页 |
·数据预处理模块 | 第46-52页 |
·数据清理 | 第46-47页 |
·页面识别 | 第47-48页 |
·用户识别 | 第48-49页 |
·会话识别 | 第49-51页 |
·页面特性导入 | 第51页 |
·事务识别 | 第51-52页 |
·基本分析模块 | 第52-54页 |
·关联分析模块 | 第54-59页 |
·频繁项目集的生成 | 第55-58页 |
·关联规则生成 | 第58-59页 |
·聚类分析模块 | 第59-64页 |
第五章 网站日志分析系统的应用 | 第64-77页 |
·实验数据介绍 | 第64页 |
·数据导入 | 第64-65页 |
·数据预处理 | 第65-70页 |
·基本统计分析 | 第70-71页 |
·关联分析 | 第71-74页 |
·聚类分析 | 第74-77页 |
总结 | 第77-79页 |
—、主要研究工作 | 第77页 |
二、不足之处及下一步要努力的方向 | 第77-79页 |
参考文献 | 第79-83页 |
致谢 | 第83-84页 |
个人简历 | 第84-85页 |
在学期间已发表和录用的论文 | 第85页 |