客户保持中两个问题的研究：对网站感兴趣用户的识别和网站质量评价

摘要	第1-7页
Abstract	第7-9页
第1章前言	第9-12页
·研究背景	第9-10页
·本文所做的工作	第10页
·本文的组织	第10-12页
第2章数据挖掘与Web挖掘概述	第12-19页
·引言	第12页
·数据挖掘	第12-15页
·Web挖掘	第15-16页
·Web挖掘的分类	第16-19页
·Web内容挖掘	第16-17页
·Web结构挖掘	第17-18页
·Web使用记录挖掘	第18-19页
第3章对网站感兴趣用户的识别	第19-33页
·概述	第19-20页
·Web日志	第20-21页
·Web日志的内容	第20页
·Web日志的预处理	第20-21页
·决策树学习	第21-28页
·决策树学习概述	第21-23页
·ID3算法	第23-26页
·C4.5算法	第26-28页
·三类访问者的特点分析	第28-29页
·对网站感兴趣的访问者	第28页
·对网站不感兴趣的访问者	第28-29页
·网络机器人	第29页
·构造分类器	第29-31页
·分类属性的选择	第29-30页
·分类属性的离散	第30-31页
·实验	第31-33页
第4章网站质量评价系统	第33-52页
·、概述	第33-34页
·Web爬行技术	第34-37页
·Robot简介	第34页
·Internet Robot Exclusion Standard	第34-36页
·Robot爬行策略分析	第36-37页
·网页信息抽取技术	第37-45页
·HTTP协议	第37-39页
·HTML语言简介	第39-41页
·HTML文档标准化	第41-43页
·信息抽取	第43-45页
·属性评价方法	第45-48页
·网站评价系统	第48-52页
·系统设计	第48-49页
·系统实现	第49-50页
·实验结果	第50-52页
第5章结束语	第52-53页
参考文献	第53-55页
读研期间发表的论文	第55-56页
致谢	第56页