| 第1章 引 言 | 第1-16页 |
| ·应用背景 | 第9-10页 |
| ·集中式搜索引擎面临的挑战 | 第10-12页 |
| ·分布式搜索引擎国内外研究 | 第12-14页 |
| ·论文的主要工作和贡献 | 第14-16页 |
| 第2章 搜索引擎技术分析 | 第16-27页 |
| ·集中式搜索引擎关键技术 | 第16-20页 |
| ·采集技术 | 第16-17页 |
| ·索引技术 | 第17-19页 |
| ·查询和用户接口 | 第19-20页 |
| ·分布式搜索引擎关键技术 | 第20-26页 |
| ·系统概述 | 第20-21页 |
| ·节点信息提取 | 第21页 |
| ·节点相关度排序算法 | 第21-24页 |
| ·排序性能评测 | 第24-25页 |
| ·结果融合 | 第25-26页 |
| ·日志分析 | 第26-27页 |
| 第3章 搜索引擎联邦体系结构 | 第27-33页 |
| ·系统概述 | 第27-28页 |
| ·体系结构 | 第28-30页 |
| ·平面中心结构(Flat Centralized Structure) | 第28-29页 |
| ·分层中心结构(Hierarchy Centralized Structure) | 第29-30页 |
| ·联邦的优势和可行性分析 | 第30-32页 |
| ·论文工作在体系结构中的位置 | 第32-33页 |
| 第4章 集中式搜索引擎关键技术实现 | 第33-52页 |
| ·实现背景 | 第33页 |
| ·系统结构 | 第33-34页 |
| ·采集技术 | 第34-36页 |
| ·采集范围控制 | 第34-35页 |
| ·采集数据预处理 | 第35-36页 |
| ·索引技术 | 第36-43页 |
| ·索引关键技术 | 第36页 |
| ·索引库结构和优化 | 第36-40页 |
| ·索引算法和优化 | 第40-41页 |
| ·网页权重计算 | 第41-43页 |
| ·查询技术 | 第43-44页 |
| ·实验分析 | 第44-52页 |
| ·实验平台基本数据 | 第44-45页 |
| ·URL链接统计分析 | 第45-46页 |
| ·索引效率分析 | 第46-49页 |
| ·索引库数据分析 | 第49-51页 |
| ·实验总结 | 第51-52页 |
| 第5章 基于日志的联邦设计 | 第52-61页 |
| ·设计思想和创新点 | 第52-53页 |
| ·基于日志分析的设计思想 | 第52-53页 |
| ·创新点 | 第53页 |
| ·基于日志分析的联邦体系结构 | 第53-56页 |
| ·平面中心结构 | 第53-54页 |
| ·分层中心结构 | 第54-55页 |
| ·关键技术 | 第55-56页 |
| ·日志协议 | 第56-57页 |
| ·节点排序算法 | 第57-61页 |
| ·设计思想 | 第57-59页 |
| ·计算方法 | 第59-60页 |
| ·正反馈控制 | 第60-61页 |
| 第6章 基于日志的联邦原型系统实现 | 第61-75页 |
| ·原型系统概述 | 第61页 |
| ·日志协议实现 | 第61-62页 |
| ·信息传输机制 | 第62-63页 |
| ·Cron自动采集 | 第62页 |
| ·消息传递 | 第62-63页 |
| ·节点信息融合与索引 | 第63-66页 |
| ·节点增量信息库生成 | 第64页 |
| ·节点索引库生成 | 第64-65页 |
| ·查询词归并 | 第65-66页 |
| ·索引库清理 | 第66页 |
| ·用户界面与查询策略 | 第66-68页 |
| ·用户界面设计 | 第66-68页 |
| ·查询策略 | 第68页 |
| ·实验分析 | 第68-75页 |
| ·节点日志信息分析 | 第68-71页 |
| ·索引库分析 | 第71-74页 |
| ·实验总结 | 第74-75页 |
| 第7章 结论与展望 | 第75-78页 |
| ·结论 | 第75-76页 |
| ·论文工作总结 | 第75-76页 |
| ·论文创新点 | 第76页 |
| ·工作展望 | 第76-78页 |
| 参考文献 | 第78-82页 |
| 致 谢 | 第82页 |
| 声 明 | 第82-83页 |
| 附录1 索引处理过程中的数据结构 | 第83页 |
| 附录2 归一化函数定义 | 第83-84页 |
| 个人简历 | 第84页 |