第一章 引言 | 第1-19页 |
1.1 论文的背景 | 第9页 |
1.2 搜索引擎的分类 | 第9-14页 |
1.2.1 目录式搜索引擎(Directory Search Engine) | 第10-11页 |
1.2.2 机器人搜索引擎(Robot Search Engine) | 第11-13页 |
1.2.3 多元搜索引擎(Meta Search Engine) | 第13-14页 |
1.3 评价搜索引擎的技术指标 | 第14-15页 |
1.4 研究动机 | 第15-17页 |
1.4.1 传统搜索引擎的不足 | 第15-17页 |
1.4.2 现有多元搜索引擎的不足 | 第17页 |
1.5 本文所做的工作 | 第17-18页 |
1.6 论文的组织 | 第18-19页 |
第二章 WebHunter的体系结构 | 第19-30页 |
2.1 引言 | 第19页 |
2.2 Agent技术 | 第19-26页 |
2.2.1 Agent的定义 | 第19-21页 |
2.2.2 Agent的结构 | 第21-22页 |
2.2.3 多Agent协作系统 | 第22-26页 |
2.2.3.1 MAS的分类 | 第23-24页 |
2.2.3.1.1 集中控制式的MAS | 第23-24页 |
2.2.3.1.2 平等协同式的MAS | 第24页 |
2.2.3.1.3 混合式的MAS | 第24页 |
2.2.3.2 多Agent的交互 | 第24-26页 |
2.3 WebHunter体系结构 | 第26-29页 |
2.3.1 信息前处理层 | 第26-28页 |
2.3.1.1 用户交互Agent | 第27页 |
2.3.1.2 查询请求分析Agent | 第27页 |
2.3.1.3 规划Agent | 第27页 |
2.3.1.4 信息检索Agent | 第27-28页 |
2.3.1.5 信息库 | 第28页 |
2.3.2 查询代理层 | 第28页 |
2.3.3 信息后处理层 | 第28页 |
2.3.4 工作流程 | 第28-29页 |
2.4 本章小结 | 第29-30页 |
第三章 信息前处理 | 第30-45页 |
3.1 引言 | 第30页 |
3.2 信息前处理 | 第30页 |
3.3 查询请求分析 | 第30-35页 |
3.3.1 为什么要统一语法规范 | 第31-32页 |
3.3.2 WebHunter语法规范 | 第32-34页 |
3.3.3 查询请求分析 | 第34-35页 |
3.4 选择搜索引擎 | 第35-42页 |
3.4.1 搜索引擎选择模块的构成 | 第35-36页 |
3.4.2 信息库内容的构成 | 第36-37页 |
3.4.3 搜索引擎选择策略 | 第37-42页 |
3.4.3.1 质量最佳方案 | 第38-41页 |
3.4.3.2 响应最快方案 | 第41页 |
3.4.3.3 结果最全方案 | 第41-42页 |
3.4.3.4 全部搜索引擎 | 第42页 |
3.5 查询参数转换 | 第42-43页 |
3.6 本章小结 | 第43-45页 |
第四章 并行查询 | 第45-54页 |
4.1 引言 | 第45页 |
4.2 并行工作的搜索引擎Agent | 第45-46页 |
4.3 搜索引擎Agent与搜索引擎服务器通话过程 | 第46-52页 |
4.3.1 建立TCP连接 | 第46-47页 |
4.3.2 发送HTTP请求 | 第47-50页 |
4.3.3 响应HTTP请求 | 第50-51页 |
4.3.4 发送请求数据 | 第51-52页 |
4.3.5 关闭TCP连接 | 第52页 |
4.4 页面分析 | 第52-53页 |
4.5 本章小结 | 第53-54页 |
第五章 信息后处理 | 第54-60页 |
5.1 引言 | 第54页 |
5.2 汇总查询结果 | 第54页 |
5.3 消除重复信息 | 第54-55页 |
5.4 信息相关性排序 | 第55-58页 |
5.4.1 传统搜索引擎的查询结果排序算法 | 第55-56页 |
5.4.2 多元搜索引擎的查询结果排列算法 | 第56-57页 |
5.4.3 WebHunter查询结果排列算法 | 第57-58页 |
5.5 无效链接检查 | 第58页 |
5.6 本章小结 | 第58-60页 |
第六章 结束语 | 第60-63页 |
6.1 总结 | 第60-62页 |
6.1.1 所做的工作 | 第60-61页 |
6.1.2 系统评价 | 第61-62页 |
6.1.3 存在的不足 | 第62页 |
6.2 进一步的工作 | 第62-63页 |
致 谢 | 第63-64页 |
参考文献 | 第64-66页 |