首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文

基于Web用途数据预处理的聚类挖掘研究

摘要第1-4页
Abstract第4-10页
第一章 绪论第10-14页
 1 提出问题第10页
 2 国内外研究动态第10-11页
 3 论文主要内容第11页
 4 现实意义第11-12页
 5 论文的组织安排第12-14页
第二章 从数据挖掘到Web挖掘第14-26页
 1 什么是数据挖掘第14-15页
  (1) 三种不同角度的定义第14-15页
  (2) KDD和数据挖掘第15页
 2 数据仓库和数据挖掘的OLAP第15-20页
  (1) 数据仓库第15-17页
  (2) OLAP第17页
  (3) 数据挖掘功能第17-19页
  (4) 数据挖掘的应用第19-20页
 3 网络上数据的特点和难点第20-22页
  (1) 特点第20-21页
  (2) 难点第21-22页
 4 Web挖掘定义第22页
 5 Web挖掘分类第22-24页
 6 Web挖掘国内外动态第24-25页
 7 聚类和数据预处理第25-26页
第三章 用途数据预处理第26-46页
 1 用途数据挖掘的意义第26页
 2 用途数据挖掘第26-28页
  (1) 术语和相关概念第27-28页
  (2) 用途数据挖掘过程第28页
 3 数据预处理工作的意义第28-31页
  (1) 明确挖掘粒度第30页
  (2) 降低挖掘空间维数第30页
  (3) 对挖掘对象进行规范化第30-31页
 4 服务器日志格式--扩展公共日志格式(ECLF)第31页
 5 预处理过程一般步骤介绍第31-36页
  (1) 数据净化第31-32页
  (2) 用户识别/会话识别第32-33页
  (3) 事务识别第33-36页
  (4) 路径完善第36页
 6 页面视图识别第36-41页
  (1) 问题的提出第36-37页
  (2) 一个改进了的用途数据预处理模型第37页
  (3) 网站结构的框架(Frame)表示第37-38页
  (4) 网页视图识别算法第38-41页
 7 实验第41-46页
  (1) 环境设定第41页
  (2) 可行性分析第41页
  (3) 实验内容第41-43页
  (4) 实验结果分析第43-44页
  (5) 评价第44-46页
第四章 点击流的聚类第46-56页
 1 聚类第46-48页
  (1) 什么是聚类第46-47页
  (2) 聚类分析的意义第47页
  (3) 聚类算法简介第47-48页
 2 点击流聚类第48-56页
  (1) 分析第48-49页
  (2) 最长共同子序列(Longest Common Subsequence, LCS)第49-50页
  (3) LCS相似度第50-51页
  (4) 相似图的生成第51-53页
  (5) 图形分割第53-56页
第五章 结论第56-60页
 1 总结第56页
 2 目前工作中出现的几个问题第56-57页
 3 下一步工作第57-60页
参考文献第60-64页
附录A: 实验运行结果第64-68页
附录B: 主要函数代码第68-72页
致谢第72-74页
在学期间发表的论文第74页

论文共74页,点击 下载论文
上一篇:慢性阻塞性肺疾病肺肾相关性研究
下一篇:纯钛螺旋式种植体在部分血供兔胫骨中结合的实验研究