基于日志的Web访问信息挖掘

摘要	第1-4页
Abstract	第4-7页
1 绪论	第7-11页
·研究背景及意义	第7-8页
·研究背景	第7页
·研究意义	第7-8页
·Web挖掘概述	第8-10页
·Web内容挖掘	第9页
·Web结构挖掘	第9-10页
·Web访问信息挖掘	第10页
·论文的组织结构	第10页
·本章小结	第10-11页
2 Web访问信息挖掘	第11-21页
·Web访问信息挖掘的体系结构	第11-14页
·Web访问信息挖掘的定义	第11页
·Web访问信息挖掘的过程	第11-12页
·Web访问信息挖掘的数据源	第12-14页
·数据预处理	第14-17页
·数据净化	第14-15页
·用户识别	第15-16页
·会话识别	第16-17页
·路径补充	第17页
·事务识别	第17页
·模式挖掘	第17-19页
·关联规则挖掘	第18页
·聚类	第18页
·分类	第18-19页
·序列模式	第19页
·模式分析及应用	第19-20页
·本章小结	第20-21页
3 模糊聚类技术	第21-35页
·模糊聚类理论发展	第21-22页
·FKM聚类算法	第22-24页
·K均值聚类算法(HKM)介绍	第22-23页
·模糊K均值聚类	第23-24页
·中心初始化策略	第24-28页
·距离优化法	第25-26页
·密度估计法	第26页
·改进的距离优化法	第26-28页
·类数目的确定	第28-34页
·引入信息熵来确定最佳中心数	第28-30页
·基于几何结构的有效性函数	第30-31页
·权和的有效性函数	第31页
·一种新的有效性函数	第31-34页
·本章小结	第34-35页
4 基于访问日志的个性化推荐	第35-45页
·引言	第35-36页
·日志的预处理	第36-38页
·所用日志示例	第36页
·用户事务集合	第36-37页
·浏览时间的离散化	第37页
·用户浏览矩阵和用户点击矩阵	第37-38页
·用户聚类和URL聚类	第38-39页
·带属性权重的欧氏距离	第38-39页
·页面权重	第39页
·用户权重	第39页
·聚类中心数目的确定	第39-41页
·抽样	第40页
·等价事务和事务约减	第40页
·全局搜索	第40-41页
·实验结果	第41-44页
·本章小结	第44-45页
5 基于查询日志的协作推荐	第45-55页
·引言	第45页
·体系结构	第45-46页
·访问日志与查询日志	第46-47页
·基于主题关注度的推荐算法	第47-49页
·相关工作	第47-48页
·主题关注度推荐算法	第48-49页
·基于查询日志的推荐算法	第49-54页
·两种不同类型的聚类算法	第50页
·基于图的迭代聚类算法	第50-51页
·改进的相似性函数	第51-52页
·实验及结果分析	第52-54页
·本章小结	第54-55页
6 总结	第55-57页
·本文工作总结	第55页
·进一步工作展望	第55-57页
致谢	第57-58页
参考文献	第58-60页