基于内容的网站聚类算法研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-19页 |
| ·课题背景 | 第9页 |
| ·课题研究的目的及意义 | 第9-10页 |
| ·国内外相关技术发展现状 | 第10-18页 |
| ·信息检索现状 | 第10-11页 |
| ·搜索引擎现状 | 第11-14页 |
| ·网站分类综述 | 第14-15页 |
| ·网站表示 | 第15-18页 |
| ·本文研究的主要内容 | 第18-19页 |
| 第2章 基于链接的网站聚类算法 | 第19-28页 |
| ·引言 | 第19页 |
| ·基于向量空间模型的网站聚类算法 | 第19-22页 |
| ·基于图模型的网站聚类算法 | 第22-24页 |
| ·分析比较 | 第24-25页 |
| ·聚类分析评估 | 第25-27页 |
| ·评价标准 | 第25-26页 |
| ·常用评价方法 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 第3章 基于内容的网站聚类算法 | 第28-43页 |
| ·引言 | 第28页 |
| ·网站内容特征提取方法 | 第28-31页 |
| ·基于后缀串的候选特征词提取方法 | 第31-36页 |
| ·网站预处理 | 第32-33页 |
| ·汉字结合模式的获取 | 第33-35页 |
| ·汉字结合模式的过滤 | 第35-36页 |
| ·基于内容的网站聚类算法 | 第36-42页 |
| ·算法流程 | 第36-37页 |
| ·相似度计算 | 第37-40页 |
| ·聚类算法 | 第40-42页 |
| ·本章小结 | 第42-43页 |
| 第4章 实验结果及评测 | 第43-55页 |
| ·引言 | 第43页 |
| ·实验环境 | 第43页 |
| ·评测方法 | 第43-45页 |
| ·实验结果及分析 | 第45-54页 |
| ·k-means聚类结果及分析 | 第45-47页 |
| ·二分k-means聚类结果及分析 | 第47-48页 |
| ·层次聚类结果及分析 | 第48-50页 |
| ·SOM聚类结果及分析 | 第50-52页 |
| ·网站聚类方法对比分析 | 第52-54页 |
| ·下一步研究工作 | 第54页 |
| ·本章小结 | 第54-55页 |
| 结论 | 第55-56页 |
| 参考文献 | 第56-60页 |
| 攻读硕士期间发表的论文 | 第60-62页 |
| 致谢 | 第62页 |