面向广域网的分布式搜索引擎中任务调度技术的研究
摘要 | 第1-4页 |
Abstract | 第4-9页 |
第1章 绪论 | 第9-15页 |
·课题背景和研究意义 | 第9-10页 |
·国内外研究现状 | 第10-13页 |
·调度问题的研究动态 | 第10-11页 |
·Web划分的研究动态 | 第11-13页 |
·本文的主要工作 | 第13-14页 |
·课题研究思路 | 第13页 |
·主要工作 | 第13-14页 |
·本文的组织结构 | 第14页 |
·本章小节 | 第14-15页 |
第2章 基于应用层测量的网络距离预测算法 | 第15-29页 |
·网络距离预测方法 | 第15-20页 |
·三角启发式算法 | 第15-16页 |
·经典网络距离预测算法 | 第16-19页 |
·路标结点的选择 | 第19-20页 |
·网络距离的应用层测量手段 | 第20-22页 |
·应用层网络距离测量操作 | 第20-21页 |
·网络时延的准确性保证 | 第21-22页 |
·PIC算法 | 第22-26页 |
·PIC算法基本框架 | 第22-23页 |
·爬山法 | 第23-24页 |
·安全测试机制 | 第24-25页 |
·PIC算法的改进 | 第25-26页 |
·PIC准确性实验 | 第26-28页 |
·本章小结 | 第28-29页 |
第3章 基于网络坐标的Web划分策略 | 第29-54页 |
·Web划分 | 第29-31页 |
·Web划分定义 | 第29-30页 |
·Web划分单元 | 第30-31页 |
·随机性Web划分算法 | 第31-32页 |
·基于网络相对位置的Web划分策略 | 第32-35页 |
·基于网络坐标的Web划分策略 | 第35-44页 |
·简单聚类算法 | 第35-38页 |
·基于迭代自组织的高质量Web划分 | 第38-44页 |
·ISODATA算法 | 第39-40页 |
·爬虫不足的划分集合的控制 | 第40-44页 |
·基于迭代自组织的高质量Web划分策略的性能验证 | 第44-53页 |
·TopK调度算法 | 第45-46页 |
·实验设置 | 第46页 |
·划分结果对比 | 第46-47页 |
·系统性能对比 | 第47-53页 |
·吞吐量对比 | 第47-52页 |
·时延累计对比 | 第52-53页 |
·实验总结 | 第53页 |
·本章小结 | 第53-54页 |
第4章 分布式任务调度及负载均衡技术 | 第54-63页 |
·分布式搜索引擎静态任务分配 | 第54-55页 |
·划分集合内部的负载均衡技术 | 第55-57页 |
·负载指标的选择 | 第55页 |
·平衡目标的确定 | 第55-56页 |
·分布式系统启动动态任务调度策略 | 第56页 |
·分布式系统迁移策略 | 第56-57页 |
·负载均衡算法 | 第57页 |
·分布式爬虫负载均衡性能试验 | 第57-62页 |
·负载累计曲线对比 | 第58-61页 |
·离散系数对比 | 第61-62页 |
·本章小结 | 第62-63页 |
第5章 分布式搜索引擎调度系统设计 | 第63-76页 |
·网络坐标计算模块 | 第64-68页 |
·爬虫的坐标计算模块 | 第64-66页 |
·调度系统的坐标计算模块 | 第66-68页 |
·Web划分模块 | 第68-72页 |
·增量划分单元 | 第70-71页 |
·IAWP划分单元 | 第71页 |
·划分计时器单元 | 第71-72页 |
·调度模块 | 第72-75页 |
·静态调度单元 | 第73-74页 |
·动态调度单元 | 第74-75页 |
·本章小结 | 第75-76页 |
结论 | 第76-78页 |
参考文献 | 第78-83页 |
攻读学位期间发表的学术论文 | 第83-85页 |
致谢 | 第85页 |