搜索引擎中文档聚类方法研究
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 目录 | 第9-11页 |
| 1 绪论 | 第11-22页 |
| ·搜索引擎 | 第12-15页 |
| ·聚类分析 | 第15-17页 |
| ·聚类分析在搜索引擎的应用 | 第17-20页 |
| ·论文研究工作内容与研究成果 | 第20-21页 |
| ·论文组织 | 第21-22页 |
| 2 基于带窗口约束的频繁项集的文本聚类算法 | 第22-42页 |
| ·频繁项集 | 第23-28页 |
| ·带窗口约束的频繁项集的定义 | 第28-32页 |
| ·带窗口约束的频繁项集的挖掘算法 | 第32-35页 |
| ·基于频繁项集的聚类算法 | 第35-37页 |
| ·算法性能评估 | 第37-41页 |
| ·小结 | 第41-42页 |
| 3 XML文档聚类方法 | 第42-67页 |
| ·基于数据类型树的XML文档聚类 | 第44-52页 |
| ·基于合并编辑距离的XML文档相似度定义 | 第52-65页 |
| ·小结 | 第65-67页 |
| 4 一种基于搜索日志的网页表示模型 | 第67-79页 |
| ·相关工作 | 第68-72页 |
| ·混合向量空间模型HVSM | 第72-75页 |
| ·实验结果和分析 | 第75-78页 |
| ·小结 | 第78-79页 |
| 5 弱链接文档搜索引擎及一种排序算法 | 第79-100页 |
| ·相关工作 | 第83-84页 |
| ·弱链接文档搜索 | 第84-86页 |
| ·弱链接文档状态的排序 | 第86-92页 |
| ·弱链接文档的排序 | 第92-93页 |
| ·实验评估 | 第93-98页 |
| ·小结 | 第98-100页 |
| 6 总结与展望 | 第100-103页 |
| 致谢 | 第103-104页 |
| 参考文献 | 第104-115页 |
| 附录1 攻读学位期间发表的学术论文 | 第115-117页 |
| 附录2 攻读学位期间参与的研究项目 | 第117页 |