首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中索引表求交和提前停止技术优化研究

中文摘要第1-7页
Abstract第7-14页
第一章 绪论第14-24页
 第一节 引言第14-15页
 第二节 搜索引擎简介第15-19页
     ·搜索引擎体系结构第15-18页
     ·搜索引擎的评价指标第18-19页
 第三节 研究内容和创新点第19-21页
 第四节 文章组织结构第21-24页
第二章 背景知识和相关工作第24-48页
 第一节 倒排索引第24-25页
 第二节 搜索引擎查询处理第25-28页
     ·查询处理流程第25-27页
     ·查询处理模式第27-28页
 第三节 文档重新排序第28页
 第四节 索引表求交第28-31页
     ·问题描述第28-29页
     ·索引表求交串行算法第29-30页
     ·索引表求交并行算法第30-31页
 第五节 索引压缩和解压缩第31-33页
     ·问题描述第31-32页
     ·压缩算法第32页
     ·压缩算法的评价第32-33页
 第六节 排序函数第33-37页
     ·词频分数(IR分数)第34-35页
     ·文档的静态排名分数(SR分数)第35-36页
     ·紧密度分数(TP分数)第36页
     ·总分第36-37页
     ·TopK分数计算第37页
 第七节 提前停止技术第37-40页
     ·问题定义第37-38页
     ·现有提前停止技术介绍第38-40页
 第八节 图形显卡和CUDA计算平台第40-46页
     ·使用图形显卡进行并行计算第40-43页
     ·Nvidia图形显卡硬件体系第43页
     ·使用CUDA对GPU进行编程第43-46页
     ·GPU算法的算法复杂度第46页
 第九节 搜索引擎设计中的权衡第46-47页
 第十节 本章小结第47-48页
第三章 索引表求交CPU算法的分析与优化第48-82页
 第一节 介绍第48-49页
 第二节 本章贡献第49页
 第三节 相关工作和背景知识第49-51页
     ·文档重新排序第49-50页
     ·现有计算机体系结构的延迟来源第50-51页
 第四节 求交算法第51-55页
     ·按表求交算法第51-52页
     ·按元素求交算法第52-55页
 第五节 搜索算法第55-63页
     ·线性搜索第55页
     ·二分搜索第55页
     ·插值搜索第55-56页
     ·倍增搜索和Golomb搜索第56页
     ·均匀分段方法第56-57页
     ·哈希分段方法第57-62页
     ·求交算法分类方式的进一步讨论第62-63页
 第六节 压缩后的索引表求交第63-64页
 第七节 实验设置第64-66页
     ·网页文档数据集第64-65页
     ·查询集第65页
     ·实验环境第65-66页
 第八节 实验结果第66-79页
     ·SvS算法性能第66-69页
     ·均匀分段方法和哈希分段方法的详细分析第69-70页
     ·依据两表相对长度比的性能评价第70-75页
     ·各种求交算法性能第75-77页
     ·压缩索引的求交性能分析第77-79页
 第九节 总结和未来工作第79-82页
第四章 利用GPU加速搜索引擎中的查询处理第82-116页
 第一节 介绍第82-83页
 第二节 研究动机和假设第83-84页
     ·非交互查询第83-84页
     ·假设和限制第84页
 第三节 本章贡献第84-85页
 第四节 查询处理模式第85-86页
     ·异步模式第85页
     ·同步模式第85-86页
 第五节 GPU单查询求交算法第86-89页
     ·线程分配第86-88页
     ·搜索第88页
     ·扫描和收缩操作第88页
     ·数据传输第88-89页
     ·算法复杂度分析第89页
     ·利用流提升吞吐率第89页
 第六节 GPU批次求交算法第89-91页
     ·线程分配第90页
     ·CPU预处理第90-91页
     ·GPU处理第91页
 第七节 搜索算法第91-100页
     ·二分搜索算法第91-92页
     ·插值搜索算法第92-93页
     ·线性回归搜索算法第93-96页
     ·哈希分段算法第96-97页
     ·Bloom Filter求交算法第97-100页
 第八节 分数计算和排序第100-103页
     ·分数计算第100-101页
     ·排序第101-103页
 第九节 实验设置第103-105页
     ·数据集和查询集第103-104页
     ·实验环境第104-105页
 第十节 实验结果第105-114页
     ·单查询模式下的GPU求交算法的性能第105-109页
     ·GPU批次算法性能第109-111页
     ·运行分时间比例第111-112页
     ·空间与时间的权衡第112-113页
     ·加速比第113页
     ·含有分数计算的查询处理的性能第113-114页
 第十一节 总结和未来工作第114-116页
第五章 优化全局排名索引的提前停止效果第116-140页
 第一节 介绍第116-118页
 第二节 本章贡献第118-119页
     ·本章采用的排序函数第119页
 第三节 问题分析第119-126页
     ·理论分析第119-124页
     ·模拟实验第124-126页
 第四节 方法第126-130页
     ·UBIR和UBTF第127页
     ·创建新的索引第127-128页
     ·查询处理策略第128-130页
 第五节 实验设置第130-132页
     ·网页文档数据集第130页
     ·查询集第130-131页
     ·实验环境第131页
     ·评价指标第131-132页
 第六节 实验结果第132-137页
     ·总体性能比较第132-133页
     ·各种索引结构的潜力第133-134页
     ·不同参数的实验第134-135页
     ·近似查询处理第135-136页
     ·查询类别的分析第136-137页
     ·使用哈希分段求交算法的查询处理性能分析第137页
 第七节 总结和未来工作第137-140页
第六章 总结和未来工作第140-144页
 第一节 全文总结第140-142页
 第二节 未来工作展望第142-144页
参考文献第144-156页
致谢第156-158页
个人简历第158-161页

论文共161页,点击 下载论文
上一篇:保留格式加密技术应用研究
下一篇:模型驱动的web应用SQL注入安全漏洞渗透测试研究