摘要 | 第1-5页 |
Abstract | 第5-8页 |
第1章 绪论 | 第8-15页 |
·课题的目的和意义 | 第8-10页 |
·研究目的 | 第8-9页 |
·研究意义 | 第9-10页 |
·国内外研究现状 | 第10-13页 |
·国外研究进展 | 第10-12页 |
·国内研究进展 | 第12-13页 |
·课题来源及本文主要研究内容 | 第13-15页 |
第2章 Web 数据挖掘技术 | 第15-26页 |
·Web 挖掘简介 | 第15-16页 |
·Web 使用信息挖掘的基本步骤 | 第16-20页 |
·数据预处理 | 第16-18页 |
·模式发现 | 第18-20页 |
·模式分析 | 第20页 |
·用户兴趣建模 | 第20-25页 |
·用户兴趣模型的定义 | 第20-21页 |
·显式用户兴趣建模与隐式用户兴趣建模 | 第21-22页 |
·文本分类、聚类技术在用户建模中的应用 | 第22-25页 |
·本章小结 | 第25-26页 |
第3章 用户兴趣挖掘的数据预处理 | 第26-42页 |
·概述 | 第26页 |
·数据预处理的基本流程 | 第26-28页 |
·日志过滤 | 第28-34页 |
·Web 日志简介 | 第28-30页 |
·Web 日志分析 | 第30-31页 |
·日志过滤器的设计与实现 | 第31-34页 |
·网页正文提取 | 第34-38页 |
·网页正文抽取的相关研究 | 第34-35页 |
·本文采用的正文抽取方法 | 第35-38页 |
·数据预处理各模块的流水线式集成 | 第38-41页 |
·本章小结 | 第41-42页 |
第4章 面向用户兴趣挖掘的聚类方法的研究 | 第42-57页 |
·聚类分析 | 第42-46页 |
·聚类的定义 | 第42页 |
·主要聚类方法 | 第42-46页 |
·文本聚类的处理流程 | 第46-47页 |
·特征提取及文本表示 | 第47-50页 |
·特征提取 | 第48-49页 |
·文本表示 | 第49-50页 |
·利用BIRCH 算法进行文本聚类 | 第50-56页 |
·隐式用户兴趣挖掘中聚类算法的选择依据 | 第50-51页 |
·DC 的定义 | 第51-52页 |
·DC-Tree | 第52-56页 |
·本章小结 | 第56-57页 |
第5章 面向Myspace 的用户兴趣建模系统及实验 | 第57-64页 |
·简介 | 第57-58页 |
·系统架构 | 第58-59页 |
·聚类实验与分析 | 第59-63页 |
·实验方案 | 第59-60页 |
·词向量维度对聚类效果的影响 | 第60-62页 |
·词向量维度对聚类时间的影响 | 第62-63页 |
·本章小结 | 第63-64页 |
结论 | 第64-65页 |
参考文献 | 第65-71页 |
致谢 | 第71页 |