第1章 引 言 | 第1-16页 |
·应用背景 | 第9-10页 |
·集中式搜索引擎面临的挑战 | 第10-12页 |
·分布式搜索引擎国内外研究 | 第12-14页 |
·论文的主要工作和贡献 | 第14-16页 |
第2章 搜索引擎技术分析 | 第16-27页 |
·集中式搜索引擎关键技术 | 第16-20页 |
·采集技术 | 第16-17页 |
·索引技术 | 第17-19页 |
·查询和用户接口 | 第19-20页 |
·分布式搜索引擎关键技术 | 第20-26页 |
·系统概述 | 第20-21页 |
·节点信息提取 | 第21页 |
·节点相关度排序算法 | 第21-24页 |
·排序性能评测 | 第24-25页 |
·结果融合 | 第25-26页 |
·日志分析 | 第26-27页 |
第3章 搜索引擎联邦体系结构 | 第27-33页 |
·系统概述 | 第27-28页 |
·体系结构 | 第28-30页 |
·平面中心结构(Flat Centralized Structure) | 第28-29页 |
·分层中心结构(Hierarchy Centralized Structure) | 第29-30页 |
·联邦的优势和可行性分析 | 第30-32页 |
·论文工作在体系结构中的位置 | 第32-33页 |
第4章 集中式搜索引擎关键技术实现 | 第33-52页 |
·实现背景 | 第33页 |
·系统结构 | 第33-34页 |
·采集技术 | 第34-36页 |
·采集范围控制 | 第34-35页 |
·采集数据预处理 | 第35-36页 |
·索引技术 | 第36-43页 |
·索引关键技术 | 第36页 |
·索引库结构和优化 | 第36-40页 |
·索引算法和优化 | 第40-41页 |
·网页权重计算 | 第41-43页 |
·查询技术 | 第43-44页 |
·实验分析 | 第44-52页 |
·实验平台基本数据 | 第44-45页 |
·URL链接统计分析 | 第45-46页 |
·索引效率分析 | 第46-49页 |
·索引库数据分析 | 第49-51页 |
·实验总结 | 第51-52页 |
第5章 基于日志的联邦设计 | 第52-61页 |
·设计思想和创新点 | 第52-53页 |
·基于日志分析的设计思想 | 第52-53页 |
·创新点 | 第53页 |
·基于日志分析的联邦体系结构 | 第53-56页 |
·平面中心结构 | 第53-54页 |
·分层中心结构 | 第54-55页 |
·关键技术 | 第55-56页 |
·日志协议 | 第56-57页 |
·节点排序算法 | 第57-61页 |
·设计思想 | 第57-59页 |
·计算方法 | 第59-60页 |
·正反馈控制 | 第60-61页 |
第6章 基于日志的联邦原型系统实现 | 第61-75页 |
·原型系统概述 | 第61页 |
·日志协议实现 | 第61-62页 |
·信息传输机制 | 第62-63页 |
·Cron自动采集 | 第62页 |
·消息传递 | 第62-63页 |
·节点信息融合与索引 | 第63-66页 |
·节点增量信息库生成 | 第64页 |
·节点索引库生成 | 第64-65页 |
·查询词归并 | 第65-66页 |
·索引库清理 | 第66页 |
·用户界面与查询策略 | 第66-68页 |
·用户界面设计 | 第66-68页 |
·查询策略 | 第68页 |
·实验分析 | 第68-75页 |
·节点日志信息分析 | 第68-71页 |
·索引库分析 | 第71-74页 |
·实验总结 | 第74-75页 |
第7章 结论与展望 | 第75-78页 |
·结论 | 第75-76页 |
·论文工作总结 | 第75-76页 |
·论文创新点 | 第76页 |
·工作展望 | 第76-78页 |
参考文献 | 第78-82页 |
致 谢 | 第82页 |
声 明 | 第82-83页 |
附录1 索引处理过程中的数据结构 | 第83页 |
附录2 归一化函数定义 | 第83-84页 |
个人简历 | 第84页 |