第1章 引言 | 第8-20页 |
1.1 研究的动机和意义 | 第8-11页 |
1.1.1 数据的海量性 | 第8页 |
1.1.2 目前搜索系统的不足 | 第8-9页 |
1.1.3 研究的意义 | 第9-11页 |
1.2 国内外相关研究情况 | 第11-16页 |
1.2.1 全文搜索研究概述 | 第11-14页 |
1.2.2 对等网络上的搜索研究 | 第14-16页 |
1.3 关键问题和面临的挑战 | 第16-18页 |
1.3.1 需解决的关键问题 | 第16-17页 |
1.3.2 面临的挑战 | 第17-18页 |
1.4 论文各部分主要内容 | 第18-20页 |
第2章 对等网络原理 | 第20-28页 |
2.1 非结构化对等网络 | 第20-21页 |
2.2 结构化对等网络 | 第21-27页 |
2.2.1 Pastry | 第22-24页 |
2.2.2 SkipNet | 第24-27页 |
2.3 小结 | 第27-28页 |
第3章 系统设计 | 第28-46页 |
3.1 总体设计 | 第28-31页 |
3.1.1 体系结构 | 第29-30页 |
3.1.2 结点的系统标识 | 第30-31页 |
3.2 模块设计 | 第31-38页 |
3.2.1 通信器(Communicator) | 第31-32页 |
3.2.2 采集器(Crawler) | 第32-33页 |
3.2.3 索引器(Indexer) | 第33-36页 |
3.2.4 查询器(Searcher) | 第36-37页 |
3.2.5 排序器(Ranker) | 第37-38页 |
3.3 模拟子系统 | 第38-40页 |
3.3.1 模拟子系统的设计 | 第38-39页 |
3.3.2 重要数据结构 | 第39-40页 |
3.4 模拟结果及分析 | 第40-44页 |
3.4.1 带宽占用 | 第42页 |
3.4.2 通信延迟 | 第42-43页 |
3.4.3 负载平衡 | 第43-44页 |
3.5 小结 | 第44-46页 |
第4章 分布式文档重要度计算 | 第46-61页 |
4.1 集中式文档重要度计算 | 第47-48页 |
4.1.1 PageRank算法 | 第47-48页 |
4.1.2 HITS算法 | 第48页 |
4.2 分布式文档重要度计算 | 第48-51页 |
4.2.1 GroupPageRank算法 | 第48-50页 |
4.2.2 分布式PageRank算法 | 第50-51页 |
4.3 理论分析 | 第51-52页 |
4.3.1 GroupPageRank算法的收敛性 | 第51-52页 |
4.3.2 分布式PageRank算法的收敛性 | 第52页 |
4.4 传输模式分析 | 第52-56页 |
4.4.1 直接传输模式 | 第53-54页 |
4.4.2 间接传输模式 | 第54-55页 |
4.4.3 收敛所需时间和带宽消耗 | 第55-56页 |
4.5 实验与分析 | 第56-60页 |
4.5.1 算法实验 | 第56-58页 |
4.5.2 传输实验 | 第58-60页 |
4.6 小结 | 第60-61页 |
第5章 PP Cache缓存策略 | 第61-75页 |
5.1 PP Cache缓存策略 | 第62-66页 |
5.1.1 Popularity的统计 | 第63页 |
5.1.2 Pop Cache和Pointer Cache | 第63-65页 |
5.1.3 缓存倒排列表 | 第65-66页 |
5.2 主动式删除操作的实现 | 第66-68页 |
5.2.1 缺少主动式删除操作的原因 | 第66-67页 |
5.2.2 备份的干净删除 | 第67-68页 |
5.2.3 Cache的删除 | 第68页 |
5.3 实验与分析 | 第68-74页 |
5.3.1 平均hop数 | 第69-70页 |
5.3.2 负载平衡 | 第70-72页 |
5.3.3 额外网络流量 | 第72-73页 |
5.3.4 主动删除 | 第73-74页 |
5.4 小结 | 第74-75页 |
第6章 结论和进一步工作 | 第75-77页 |
6.1 结论 | 第75-76页 |
6.2 进一步的工作 | 第76-77页 |
参考文献 | 第77-83页 |
致 谢 | 第83-84页 |
附录 分布式PageRank算法收敛性的相关证明 | 第84-87页 |
本人简历 | 第87页 |
攻读硕士学位期间发表的学术论文 | 第87页 |