| 摘要 | 第1-6页 |
| ABSTRACT | 第6-16页 |
| 第1章 绪论 | 第16-32页 |
| ·课题背景及研究的目的和意义 | 第16-19页 |
| ·研究现状分析 | 第19-30页 |
| ·概述 | 第19-21页 |
| ·Web 划分 | 第21-23页 |
| ·任务调度 | 第23-25页 |
| ·节点协同 | 第25-28页 |
| ·评价模型 | 第28-29页 |
| ·研究现状总结 | 第29-30页 |
| ·本文的主要研究内容 | 第30-32页 |
| 第2章 分布式搜索引擎成本模型研究 | 第32-55页 |
| ·引言 | 第32-33页 |
| ·相关工作 | 第33-34页 |
| ·本章主要内容 | 第34页 |
| ·分布式搜索引擎系统建模与分析 | 第34-36页 |
| ·分布式搜索引擎系统的成本模型 | 第36-39页 |
| ·多机采集系统的比较 | 第39-44页 |
| ·单机群采集系统与多机群采集系统成本比较 | 第39-40页 |
| ·多机群采集系统与广域网采集系统成本比较 | 第40-42页 |
| ·广域网采集系统所需采集节点规模分析 | 第42-44页 |
| ·多机采集系统比较结果 | 第44页 |
| ·多机索引系统的比较 | 第44-53页 |
| ·单机群索引系统与多机群索引系统成本比较 | 第44-49页 |
| ·广域网索引系统所需索引节点规模分析 | 第49-51页 |
| ·多机群索引系统与广域网索引系统比较 | 第51-52页 |
| ·多机索引系统比较结果 | 第52-53页 |
| ·半广域网搜索引擎系统 | 第53-54页 |
| ·本章小结 | 第54-55页 |
| 第3章 基于网络距离的分布式 Web 划分算法 | 第55-74页 |
| ·引言 | 第55页 |
| ·相关工作 | 第55-57页 |
| ·本章主要内容 | 第57页 |
| ·Web 信息采集系统中的网络距离 | 第57-66页 |
| ·网络距离的定义 | 第57-59页 |
| ·网络距离的测量 | 第59-60页 |
| ·网络距离稳定性实验 | 第60-63页 |
| ·RTT 与下载速率间关系实验 | 第63-65页 |
| ·网络坐标系统介绍 | 第65-66页 |
| ·网络距离小结 | 第66页 |
| ·基于网络坐标和内容寻址网络的分布式Web 划分算法 | 第66-73页 |
| ·从物理主机到覆盖网资源的三层映射机制 | 第67-68页 |
| ·网络坐标空间与CAN 空间的边界问题 | 第68-70页 |
| ·在线实验验证 | 第70-73页 |
| ·Web 划分算法小结 | 第73页 |
| ·本章小结 | 第73-74页 |
| 第4章 基于负载转发和Web 主机切分的负载均衡算法 | 第74-104页 |
| ·引言 | 第74-75页 |
| ·相关工作 | 第75-76页 |
| ·本章主要工作 | 第76页 |
| ·基于NC-CAN 中任务转发的插入时负载均衡算法 | 第76-85页 |
| ·负载均衡重要性的理论分析 | 第76-78页 |
| ·负载均衡算法LBI | 第78-82页 |
| ·在线实验验证 | 第82-85页 |
| ·负载均衡小结 | 第85页 |
| ·基于主干路径的Web 主机切分算法 | 第85-92页 |
| ·Web 主机切分的相关定义 | 第86页 |
| ·网页在Web 主机上的分布统计 | 第86-88页 |
| ·Web 主机切分算法 | 第88-89页 |
| ·离线实验验证 | 第89-92页 |
| ·Web 主机切分小结 | 第92页 |
| ·采集系统动态性模拟 | 第92-103页 |
| ·模拟设置 | 第92-95页 |
| ·模拟结果 | 第95-102页 |
| ·实验总结 | 第102-103页 |
| ·本章小结 | 第103-104页 |
| 第5章 低协同开销的Web 划分算法 | 第104-128页 |
| ·引言 | 第104-105页 |
| ·相关工作 | 第105-106页 |
| ·本章主要工作 | 第106-107页 |
| ·基于链接距离的低协同开销Web 划分算法 | 第107-111页 |
| ·链接坐标的定义 | 第107-108页 |
| ·链接坐标的生成方法 | 第108-111页 |
| ·采集节点的链接坐标 | 第111页 |
| ·分布式双目标Web 划分算法 | 第111-115页 |
| ·多空间法 | 第112-115页 |
| ·多维度法 | 第115页 |
| ·实验与评价 | 第115-126页 |
| ·实验设置 | 第115-120页 |
| ·面向链接坐标的Web 划分实验 | 第120-123页 |
| ·双目标Web 划分实验 | 第123-126页 |
| ·实验总结 | 第126页 |
| ·本章小结 | 第126-128页 |
| 第6章 一种广域网分布式Web 信息采集系统架构设计 | 第128-141页 |
| ·引言 | 第128-129页 |
| ·相关工作 | 第129-130页 |
| ·本章主要工作 | 第130页 |
| ·系统架构 | 第130-131页 |
| ·模块结构及工作原理 | 第131-140页 |
| ·节点间协同协议 | 第131-133页 |
| ·频道 | 第133-134页 |
| ·管理节点 | 第134-135页 |
| ·采集节点 | 第135-137页 |
| ·网络坐标系统 | 第137-139页 |
| ·接收及存储系统 | 第139-140页 |
| ·本文提出算法在系统中的实现 | 第140页 |
| ·基于网络距离的Web 划分算法 | 第140页 |
| ·负载均衡算法 | 第140页 |
| ·低协同开销的Web 划分算法 | 第140页 |
| ·本章小结 | 第140-141页 |
| 结论 | 第141-143页 |
| 参考文献 | 第143-152页 |
| 攻读博士学位期间发表的论文及其它成果 | 第152-155页 |
| 致谢 | 第155-156页 |
| 个人简历 | 第156页 |