首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MPI的分布式搜索引擎设计与实现

摘要第1-5页
Abstract第5-9页
1 绪论第9-14页
   ·研究背景第9-10页
     ·互联网与搜索引擎第9页
     ·搜索引擎发展现状第9-10页
   ·本文研究的主要内容与意义第10页
   ·消息传递接口MPI简介第10-13页
     ·MPI的发展历史与现状第10-11页
     ·MPI的基本功能第11-12页
     ·MPI的进程间通信简介第12-13页
   ·论文各部分主要内容第13-14页
2 分布式网页抓取系统第14-27页
   ·总体设计第14-17页
     ·主从式通信结构第15页
     ·抓取系统的架构第15-16页
     ·网页抓取策略第16-17页
   ·系统详细设计第17-27页
     ·Master进程设计第17-18页
     ·Slaver进程设计第18-20页
     ·网页抓取器第20-22页
     ·网页解析器第22-23页
     ·链接过滤器第23-24页
     ·内容记录器第24-27页
3 分布式索引构建系统第27-40页
   ·相关技术简介第27-30页
     ·倒排索引简介第27-28页
     ·MapReduce简介第28页
     ·TF-IDF简介第28-30页
   ·分布式文档索引的构建第30-33页
     ·文档编号的分配第30-32页
     ·文档索引的构建第32-33页
   ·MapReduce 用于倒排索引的构建第33-40页
     ·倒排索引的Map过程第34-35页
     ·倒排索引的Reduce过程第35-38页
     ·倒排索引的生成第38-40页
4 分布式网页重要性计算系统第40-56页
   ·链接分析技术简介第40-43页
     ·PageRank算法第40-42页
     ·HITS算法第42-43页
   ·分布式PageRank算法第43-51页
     ·分布式PageRank算法分析第43-45页
     ·PageRank计算的MapReduce过程第45-49页
     ·PageRank计算的迭代过程第49-51页
     ·算法收敛性分析第51页
   ·系统测试与结果第51-56页
     ·正确性测试第51-53页
     ·收敛性测试第53-56页
5 分布式检索系统第56-66页
   ·相关技术简介第56-57页
     ·查询评分第56页
     ·信息检索模型第56-57页
   ·系统架构第57-62页
     ·整体结构第57-58页
     ·web服务器第58-59页
     ·搜索服务器第59页
     ·结果排序服务器第59-61页
     ·索引服务器第61-62页
   ·多级排序规则第62-66页
     ·一级排序第62-63页
     ·二级排序第63-66页
结论第66-67页
参考文献第67-70页
致谢第70-71页

论文共71页,点击 下载论文
上一篇:公共事业连销缴费电子商务系统的设计与实现
下一篇:基于固有特征的复印文档取证研究