首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce的信息检索相关算法并行化研究与实现

摘要第1-7页
Abstract第7-9页
目录第9-11页
第一章 绪论第11-20页
   ·研究背景第11-12页
     ·高速增长的海量数据使得并行计算成为趋势第11页
     ·信息检索领域的并行化发展趋势第11-12页
   ·并行计算领域的发展现状第12-15页
     ·并行计算概述第12-13页
     ·MapReduce并行计算模型与Hadoop并行计算框架软件第13-15页
   ·并行信息检索技术研究现状第15-17页
     ·分布式搜索引擎概述第15页
     ·并行信息检索算法研究现状第15-17页
       ·查询推荐算法及其并行化研究进展第16-17页
       ·网页排序算法及其并行化研究进展第17页
   ·本文研究内容和主要工作第17-18页
     ·对QUBIC算法的并行化改造第18页
     ·基于用户日志的网页排序并行优化算法第18页
   ·本文的组织结构第18-20页
第二章 基于MapReduce的QUBIC算法并行化研究与实现第20-39页
   ·QUBIC算法第20-23页
     ·日志文件的数据格式第20页
     ·QUBIC算法第20页
     ·构造Query-URL二部图第20-22页
     ·构造QAG第22页
     ·计算QAG中的连通分量第22-23页
     ·Query排序第23页
   ·基于MapReduce对QUBIC算法进行并行化改造第23-32页
     ·基于MapReduce构造Query-URL二部图第24-25页
     ·基于MapReduce构造QAG第25-28页
     ·基于MapReduce计算QAG中的连通分量第28-32页
       ·计算QAG的传递闭包第29-31页
       ·从传递闭包计算连通分量第31-32页
   ·实验设计与结果分析第32-37页
     ·处理器的可扩展性实验第33-34页
     ·数据的可扩展性实验第34-36页
     ·加速比性能评测实验第36-37页
   ·小结第37-39页
第三章 基于MapReduce及频繁项集挖掘的页面排序优化并行算法第39-52页
   ·频繁项集挖掘第39-42页
     ·Apriori算法第39-40页
     ·SON算法第40-42页
   ·并行SON算法第42-45页
     ·第一轮MapReduce迭代:计算全局候选项集第42-43页
     ·第二轮MapReduce迭代:计算全局频繁项集第43-45页
   ·基于PSON的页面排序优化并行算法第45-48页
     ·第一轮MapReduce迭代:计算全局候选URL项集第46-47页
     ·第二轮MapReduce迭代:计算全局频繁URL项集第47-48页
   ·实验设计与结果分析第48-51页
     ·处理器的可扩展性实验第48-49页
     ·数据的可扩展性实验第49-50页
     ·加速比性能评测实验第50-51页
   ·小结第51-52页
第四章 原型系统及综合实验第52-57页
   ·原型系统总体设计第52-54页
   ·系统测试数据第54-55页
   ·原型系统运行第55-56页
   ·小结第56-57页
第五章 总结与展望第57-59页
   ·本文的总结第57页
   ·下一步的工作第57-59页
参考文献第59-61页
致谢第61-62页
附录第62-63页

论文共63页,点击 下载论文
上一篇:基于信息流的SELinux策略分析与调整技术研究
下一篇:基于虚拟化的恶意软件分析工具的研究与实现