首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式搜索引擎研究

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-18页
   ·本文的研究背景及意义第10-11页
   ·国内外研究现状第11-13页
   ·分布式系统基础架构 Hadoop第13-16页
   ·论文所做的工作以及论文结构第16-18页
第2章 网页数据抓取第18-26页
   ·HTTP 请求和响应第18-19页
   ·爬虫集群第19-20页
   ·作业生命周期第20-21页
   ·网页爬取策略第21-24页
   ·分布式存储架构第24-25页
   ·本章小结第25-26页
第3章 数据去重第26-37页
   ·数据去重简介第26-27页
   ·布隆过滤器第27-30页
     ·布隆过滤器算法第27-28页
     ·布隆过滤器理论分析第28-30页
   ·动态布隆过滤器第30-31页
   ·布隆过滤器的误判率和饱和度第31-32页
   ·二路平衡动态布隆过滤器第32-36页
     ·二路平衡动态布隆过滤器算法第32-33页
     ·二路平衡动态布隆过滤器性能第33-36页
   ·本章小结第36-37页
第4章 分布式索引系统第37-43页
   ·倒排索引第37-39页
   ·链接排名算法 PageRank第39-42页
     ·PageRank 算法第39-41页
     ·PageRank 的 Map/Reduce 计算模型第41-42页
   ·本章小结第42-43页
第5章 实现一个简单的分布式搜索引擎第43-52页
   ·基本实验环境第43页
   ·分布式搜索引擎配置第43-46页
     ·SSH 服务配置第43-44页
     ·Hadoop 核心配置第44-46页
   ·Nutch 平台第46-49页
     ·Nutch 的基本组成和工作流程第46-47页
     ·Nutch 平台配置第47-49页
   ·抓取结果分析第49-52页
第6章 总结与展望第52-54页
   ·工作总结第52页
   ·展望第52-54页
参考文献第54-56页
致谢第56-57页
攻读硕士期间发表(含录用)的学术论文第57页

论文共57页,点击 下载论文
上一篇:源头调质生物航空燃油制备及改性研究
下一篇:变形履带机器人的运动特性分析