第一章 绪论 | 第1-9页 |
§1.1 课题的意义 | 第7页 |
§1.2 论文工作和组织 | 第7-9页 |
第二章 元搜索引擎概述 | 第9-17页 |
§2.1 元搜索引擎基本构成 | 第9-11页 |
§2.2 元搜索引擎分类 | 第11-12页 |
§2.3 与独立搜索引擎的比较 | 第12-13页 |
§2.4 主要指标的分析 | 第13-17页 |
第三章 成员搜索引擎的选择策略 | 第17-27页 |
§3.1 定性的方法 | 第18-21页 |
§3.1.1 CORI Net方法 | 第18-19页 |
§3.1.2 gGLOSS方法 | 第19-21页 |
§3.2 定量的方法 | 第21-23页 |
§3.2.1 估计潜在有用文件的数量 | 第21-22页 |
§3.2.2 估计最相似文件的相似度 | 第22-23页 |
§3.3 基于学习的方法 | 第23-27页 |
§3.3.1 SavvySearch方法 | 第24-25页 |
§3.3.2 ProFusion方法 | 第25-27页 |
第四章 基于N-GRAM的搜索结果自动分类 | 第27-46页 |
§4.1 文本信息分类概述 | 第27-28页 |
§4.2 文本分类的基本原理 | 第28-33页 |
§4.2.1 基本的概念 | 第29-31页 |
§4.2.2 关联度测度 | 第31-32页 |
§4.2.3 文本分类器的结构 | 第32-33页 |
§4.3 现行的文档分类模型 | 第33-38页 |
§4.3.1 INaive Bayes模型 | 第33-34页 |
§4.3.2 实例映射模型 | 第34-35页 |
§4.3.3 神经网络模型 | 第35-36页 |
§4.3.4 向量空间模型 | 第36-38页 |
§4.4 基于N-GHAM的跨语种的自动分类 | 第38-46页 |
§4.4.1 基于n-Gram的文本特征表示以及文本间的相似度 | 第38-39页 |
§4.4.2 批处理算法 | 第39-42页 |
§4.4.3 n-Gram的Hash变换和在线处理处法 | 第42-45页 |
§4.4.4 算法的复杂度 | 第45-46页 |
第五章 系统的设计和评价 | 第46-58页 |
§5.1 系统的实现 | 第46-55页 |
§5.1.1 用户接口部分 | 第47-49页 |
§5.1.2 查询代理部分 | 第49页 |
§5.1.3 结果输出部分 | 第49-53页 |
§5.1.4 软件实现要点 | 第53-55页 |
§5.2 系统的评价 | 第55-58页 |
§5.2.1 检索时间 | 第55-56页 |
§5.2.2 查准率 | 第56-58页 |
第六章 结束语 | 第58-60页 |
§6.1 元搜索引擎的局限性 | 第58-59页 |
§6.2 未来元搜索引擎的发展方向 | 第59-60页 |
致谢 | 第60-61页 |
参考文献 | 第61-63页 |