搜索引擎中文档聚类方法研究
摘要 | 第1-6页 |
Abstract | 第6-9页 |
目录 | 第9-11页 |
1 绪论 | 第11-22页 |
·搜索引擎 | 第12-15页 |
·聚类分析 | 第15-17页 |
·聚类分析在搜索引擎的应用 | 第17-20页 |
·论文研究工作内容与研究成果 | 第20-21页 |
·论文组织 | 第21-22页 |
2 基于带窗口约束的频繁项集的文本聚类算法 | 第22-42页 |
·频繁项集 | 第23-28页 |
·带窗口约束的频繁项集的定义 | 第28-32页 |
·带窗口约束的频繁项集的挖掘算法 | 第32-35页 |
·基于频繁项集的聚类算法 | 第35-37页 |
·算法性能评估 | 第37-41页 |
·小结 | 第41-42页 |
3 XML文档聚类方法 | 第42-67页 |
·基于数据类型树的XML文档聚类 | 第44-52页 |
·基于合并编辑距离的XML文档相似度定义 | 第52-65页 |
·小结 | 第65-67页 |
4 一种基于搜索日志的网页表示模型 | 第67-79页 |
·相关工作 | 第68-72页 |
·混合向量空间模型HVSM | 第72-75页 |
·实验结果和分析 | 第75-78页 |
·小结 | 第78-79页 |
5 弱链接文档搜索引擎及一种排序算法 | 第79-100页 |
·相关工作 | 第83-84页 |
·弱链接文档搜索 | 第84-86页 |
·弱链接文档状态的排序 | 第86-92页 |
·弱链接文档的排序 | 第92-93页 |
·实验评估 | 第93-98页 |
·小结 | 第98-100页 |
6 总结与展望 | 第100-103页 |
致谢 | 第103-104页 |
参考文献 | 第104-115页 |
附录1 攻读学位期间发表的学术论文 | 第115-117页 |
附录2 攻读学位期间参与的研究项目 | 第117页 |