基于WEB挖掘技术的网页自动分类和聚类的研究
| 第一章 相关背景介绍 | 第1-14页 |
| ·Web挖掘 | 第7-11页 |
| ·Web挖掘的概念及分类 | 第7-8页 |
| ·Web内容挖掘 | 第8-10页 |
| ·Web 结构挖掘 | 第10页 |
| ·Web数据挖掘的难点 | 第10-11页 |
| ·文本分类 | 第11-13页 |
| ·文本聚类 | 第13-14页 |
| 第二章 传统文本分类和聚类技术 | 第14-29页 |
| ·传统文本分类技术 | 第14-19页 |
| ·文本的表示 | 第14-15页 |
| ·特征抽取 | 第15-16页 |
| ·常用分类算法 | 第16-19页 |
| ·阈值的选择 | 第19页 |
| ·传统文本聚类技术 | 第19-29页 |
| ·层次凝聚法 | 第19-20页 |
| ·平面划分法 | 第20-23页 |
| ·神经网络聚类方法 | 第23-25页 |
| ·学习矢量量化的聚类方法 | 第25-26页 |
| ·简单贝页斯聚类算法 | 第26-27页 |
| ·聚类质量的评估 | 第27-29页 |
| 第三章 基于Web挖掘的自动分类技术 | 第29-36页 |
| ·单个网站的分类模式抽取 | 第29-33页 |
| ·通过链接分析得到网站的简明拓扑结构 | 第30-31页 |
| ·分类模式生成 | 第31-33页 |
| ·分类的自动命名 | 第33页 |
| ·综合产生搜索引擎分类模式 | 第33-36页 |
| 第四章 基于Web挖掘的聚类技术 | 第36-47页 |
| ·检索后聚类算法的特性 | 第36-38页 |
| ·后缀树算法 | 第38-45页 |
| ·后缀树定义 | 第38-41页 |
| ·STC算法 | 第41-45页 |
| ·基于Web挖掘的STC聚类 | 第45-47页 |
| 第五章 结论与展望 | 第47-49页 |
| 参考文献 | 第49-52页 |
| 发表论文和科研情况说明 | 第52-53页 |
| 致 谢 | 第53页 |