基于WEB挖掘技术的网页自动分类和聚类的研究

第一章相关背景介绍	第1-14页
·Web挖掘	第7-11页
·Web挖掘的概念及分类	第7-8页
·Web内容挖掘	第8-10页
·Web 结构挖掘	第10页
·Web数据挖掘的难点	第10-11页
·文本分类	第11-13页
·文本聚类	第13-14页
第二章传统文本分类和聚类技术	第14-29页
·传统文本分类技术	第14-19页
·文本的表示	第14-15页
·特征抽取	第15-16页
·常用分类算法	第16-19页
·阈值的选择	第19页
·传统文本聚类技术	第19-29页
·层次凝聚法	第19-20页
·平面划分法	第20-23页
·神经网络聚类方法	第23-25页
·学习矢量量化的聚类方法	第25-26页
·简单贝页斯聚类算法	第26-27页
·聚类质量的评估	第27-29页
第三章基于Web挖掘的自动分类技术	第29-36页
·单个网站的分类模式抽取	第29-33页
·通过链接分析得到网站的简明拓扑结构	第30-31页
·分类模式生成	第31-33页
·分类的自动命名	第33页
·综合产生搜索引擎分类模式	第33-36页
第四章基于Web挖掘的聚类技术	第36-47页
·检索后聚类算法的特性	第36-38页
·后缀树算法	第38-45页
·后缀树定义	第38-41页
·STC算法	第41-45页
·基于Web挖掘的STC聚类	第45-47页
第五章结论与展望	第47-49页
参考文献	第49-52页
发表论文和科研情况说明	第52-53页
致谢	第53页