基于后缀树聚类算法的元搜索引擎的设计与实现

摘要	第4-6页
Abstract	第6-7页
第1章绪论	第12-15页
1.1 研究背景	第12-13页
1.2 工作内容	第13-14页
1.3 论文组织结构	第14-15页
第2章相关技术概念	第15-24页
2.1 搜索引擎	第15-20页
2.1.1 搜索引擎评价指标	第15页
2.1.2 搜索引擎分类	第15-18页
2.1.3 元搜索引擎模块	第18-19页
2.1.4 元搜索引擎的发展方向	第19-20页
2.2 文本聚类算法	第20-23页
2.2.1 文本聚类的概念	第20页
2.2.2 文本聚类的评价标准	第20-21页
2.2.3 文本聚类的主要算法	第21-22页
2.2.3.1 基于层次的方法	第21页
2.2.3.2 基于划分的方法	第21-22页
2.2.3.3 基于网格的方法	第22页
2.2.3.4 基于神经网络的方法	第22页
2.2.4 聚类算法的发展方向	第22-23页
2.3 小结	第23-24页
第3章基于后缀树的元搜索引擎的设计与实现	第24-48页
3.1 系统架构	第24-25页
3.2 用户界面	第25-26页
3.3 检索接口代理	第26-27页
3.4 预处理模块	第27-31页
3.4.1 中文分词	第27-29页
3.4.2 去停用词	第29-30页
3.4.3 倒排索引	第30-31页
3.5 后缀树聚类模块	第31-36页
3.5.1 接口设计	第31页
3.5.2 后缀树的概念	第31-32页
3.5.3 后缀树的构建	第32-35页
3.5.4 后缀树聚类算法的优点	第35页
3.5.5 类簇的合并	第35-36页
3.6 标签生成模块	第36-40页
3.6.1 TF-IDF算法	第37页
3.6.2 针对中文的标签评分	第37页
3.6.3 中文词性分析	第37-39页
3.6.4 标签权值计算公式	第39页
3.6.5 根据标签进行二次合并	第39-40页
3.7 类簇过滤重分模块	第40-45页
3.7.1 无意义标签产生的原因分析	第41-42页
3.7.2 基于中文的启发式过滤规则	第42-43页
3.7.3 过滤重分算法	第43-45页
3.8 结果处理模块	第45-47页
3.8.1 排序	第45-46页
3.8.2 融合和还原	第46-47页
3.9 本章小结	第47-48页
第4章系统测试	第48-55页
4.1 实验环境	第48页
4.2 测试	第48-53页
4.2.1 聚类算法响应时间：	第48-50页
4.2.2 类簇覆盖率	第50-51页
4.2.3 标签可读性	第51-53页
4.3 系统性能分析	第53-54页
4.4 系统改进构想	第54-55页
第5章结论	第55-56页
参考文献	第56-58页
作者简介	第58-59页
致谢	第59页