Web用户使用模式与兴趣挖掘方法研究
摘要 | 第1-6页 |
Abstract | 第6-11页 |
1 引言 | 第11-20页 |
·选题的相关背景 | 第11-15页 |
·选题的研究意义和价值 | 第15-17页 |
·论文的研究思路与内容安排 | 第17-20页 |
·论文的研究思路 | 第17-19页 |
·论文的内容组织与安排 | 第19-20页 |
2 Web使用挖掘技术概述与研究现状 | 第20-40页 |
·数据采集 | 第21-25页 |
·服务器端数据采集 | 第22-23页 |
·应用服务器端数据采集 | 第23-24页 |
·客户端数据采集 | 第24页 |
·代理服务器端数据采集 | 第24-25页 |
·数据预处理 | 第25-29页 |
·Web访问数据清理 | 第26-27页 |
·Web用户识别 | 第27-28页 |
·访问会话识别 | 第28页 |
·访问事务识别 | 第28-29页 |
·遗失路径补充 | 第29页 |
·模式挖掘与分析 | 第29-35页 |
·访问模式挖掘 | 第29-34页 |
·模式分析技术 | 第34-35页 |
·Web使用挖掘的应用系统 | 第35-39页 |
·通用系统 | 第36页 |
·商业智能 | 第36-37页 |
·个性化服务 | 第37-38页 |
·Web性能改进和设计优化 | 第38-39页 |
·隐私保护问题 | 第39页 |
·本章小结 | 第39-40页 |
3 基于URL语义分析的Web用户会话识别方法 | 第40-56页 |
·引言 | 第40-43页 |
·Web日志的数据模型 | 第43-45页 |
·基于Web目录概念化URL | 第45-46页 |
·基于URL语义分析的会话识别方法 | 第46-51页 |
·基本符号和相关定义 | 第47-48页 |
·静态Web日志中的语义奇异值鉴别 | 第48-50页 |
·Web日志流中的语义奇异值鉴别 | 第50-51页 |
·实验验证和讨论 | 第51-54页 |
·识别会话方法的评估 | 第51-52页 |
·实验结果与分析 | 第52-54页 |
·本章小结 | 第54-56页 |
4 基于Web历史访问特性的用户聚类方法 | 第56-83页 |
·引言 | 第56-63页 |
·聚类分析概述 | 第56-59页 |
·问题的提出及相关研究进展 | 第59-62页 |
·相关应用分析 | 第62-63页 |
·PP-WAP抽取中的相关问题描述 | 第63-65页 |
·扩展WAS集树的表示 | 第64页 |
·历史WAS集树的表示 | 第64-65页 |
·PP-WAP的定义与抽取算法 | 第65-69页 |
·PP-WAP的定义 | 第65-67页 |
·PP-WAP抽取算法描述 | 第67-69页 |
·Web用户的相似度度量 | 第69-73页 |
·两类PP-WAP的定义 | 第69-70页 |
·PP-WAP之间的相似性度量 | 第70-72页 |
·Web用户的相似性度量 | 第72-73页 |
·Web用户聚类方法框架 | 第73-74页 |
·相似度计算 | 第73-74页 |
·Web用户簇的生成 | 第74页 |
·实验验证和讨论 | 第74-81页 |
·PP-WAP抽取实验分析 | 第74-79页 |
·Web用户聚类实验分析 | 第79-81页 |
·本章小结 | 第81-83页 |
5 基于HMM的用户兴趣关联模式发现 | 第83-108页 |
·引言 | 第83-90页 |
·关联模式概述 | 第84-85页 |
·马尔可夫与隐马尔可夫模型 | 第85-89页 |
·相关研究进展 | 第89-90页 |
·相关准备工作 | 第90-95页 |
·用户访问页面时间 | 第90-92页 |
·网页关键字的提取 | 第92-93页 |
·用户访问兴趣定义 | 第93-95页 |
·用户兴趣关联模式 | 第95-99页 |
·用户兴趣浏览路径模型 | 第95-96页 |
·相对于特定页面p_e的用户兴趣浏览路径模型 | 第96-97页 |
·用户兴趣关联模式发现 | 第97-99页 |
·实验验证和讨论 | 第99-107页 |
·模拟实验 | 第99-102页 |
·带有实际背景的实验 | 第102-105页 |
·与传统方法的对比实验 | 第105-107页 |
·本章小结 | 第107-108页 |
6 总结与展望 | 第108-110页 |
·全文创新点总结 | 第108-109页 |
·研究展望 | 第109-110页 |
参考文献 | 第110-119页 |
攻读博士学位期间发表学术论文情况 | 第119-121页 |
致谢 | 第121-122页 |
作者简介 | 第122-124页 |