基于WEB挖掘技术的网页自动分类和聚类的研究
第一章 相关背景介绍 | 第1-14页 |
·Web挖掘 | 第7-11页 |
·Web挖掘的概念及分类 | 第7-8页 |
·Web内容挖掘 | 第8-10页 |
·Web 结构挖掘 | 第10页 |
·Web数据挖掘的难点 | 第10-11页 |
·文本分类 | 第11-13页 |
·文本聚类 | 第13-14页 |
第二章 传统文本分类和聚类技术 | 第14-29页 |
·传统文本分类技术 | 第14-19页 |
·文本的表示 | 第14-15页 |
·特征抽取 | 第15-16页 |
·常用分类算法 | 第16-19页 |
·阈值的选择 | 第19页 |
·传统文本聚类技术 | 第19-29页 |
·层次凝聚法 | 第19-20页 |
·平面划分法 | 第20-23页 |
·神经网络聚类方法 | 第23-25页 |
·学习矢量量化的聚类方法 | 第25-26页 |
·简单贝页斯聚类算法 | 第26-27页 |
·聚类质量的评估 | 第27-29页 |
第三章 基于Web挖掘的自动分类技术 | 第29-36页 |
·单个网站的分类模式抽取 | 第29-33页 |
·通过链接分析得到网站的简明拓扑结构 | 第30-31页 |
·分类模式生成 | 第31-33页 |
·分类的自动命名 | 第33页 |
·综合产生搜索引擎分类模式 | 第33-36页 |
第四章 基于Web挖掘的聚类技术 | 第36-47页 |
·检索后聚类算法的特性 | 第36-38页 |
·后缀树算法 | 第38-45页 |
·后缀树定义 | 第38-41页 |
·STC算法 | 第41-45页 |
·基于Web挖掘的STC聚类 | 第45-47页 |
第五章 结论与展望 | 第47-49页 |
参考文献 | 第49-52页 |
发表论文和科研情况说明 | 第52-53页 |
致 谢 | 第53页 |