基于聚类的网页相关性挖掘技术研究

摘要	第3-4页
Abstract	第4页
目录	第5-7页
第一章引言	第7-9页
1.1 研究的背景和意义	第7-8页
1.2 论文的组织	第8-9页
第二章数据挖掘技术和网页挖掘技术概述	第9-15页
2.1 数据挖掘技术	第9-12页
2.1.1 数据挖掘技术的产生	第9页
2.1.2 数据挖掘的定义	第9-10页
2.1.3 数据挖掘的研究内容	第10页
2.1.4 数据挖掘的功能分类	第10-11页
2.1.5 数据挖掘的发展方向	第11-12页
2.2 网页挖掘技术	第12-14页
2.2.1 网页挖掘的定义	第12页
2.2.2 网页挖掘的分类	第12-13页
2.2.3 网页挖掘的挑战	第13-14页
2.3 网页挖掘与数据挖掘的区别	第14-15页
第三章聚类分析算法	第15-26页
3.1 聚类分析概述	第15-18页
3.2 聚类分析中的数据表示	第18-19页
3.2.1 数据矩阵	第18-19页
3.2.2 差异矩阵	第19页
3.3 聚类分析中距离度量	第19-21页
3.3.1 数值型变量的距离度量	第19-20页
3.3.2 二值变量的距离度量	第20-21页
3.4 聚类分析算法分类	第21-22页
3.5 常用的聚类分析方法	第22-26页
3.5.1 k-means 算法	第22-23页
3.5.2 k-medoids 算法	第23-24页
3.5.3 层次聚类算法	第24-25页
3.5.4 动态聚类算法	第25-26页
第四章网页文本内容的特征抽取	第26-37页
4.1 检索模型的比较和选择	第26-28页
4.2 权重的计算	第28-30页
4.3 特征的选择	第30-32页
4.4 重复短语的识别	第32-37页
第五章网页相关性挖掘原型系统实现	第37-42页
5.1 系统设计	第37-40页
5.1.1 系统的架构和功能设计	第37-38页
5.1.2 系统的接口设计	第38-40页
5.2 系统运行结果	第40-41页
5.3 系统评价	第41-42页
第六章结论	第42-43页
参考文献	第43-45页
后记	第45-46页
在学期间公开发表论文及著作情况	第46页