摘要 | 第4-6页 |
abstract | 第6-8页 |
第一章 绪论 | 第12-19页 |
1.1 研究背景及意义 | 第12-13页 |
1.2 国内外研究现状 | 第13-16页 |
1.2.1 全文检索的国内外研究现状 | 第13-14页 |
1.2.2 分布式全文检索的国内外研究现状 | 第14-16页 |
1.3 研究内容 | 第16-17页 |
1.4 论文结构 | 第17-19页 |
第二章 基于分块式链表索引结构的全文检索算法BLIS | 第19-34页 |
2.1 传统全文检索算法 | 第19-21页 |
2.1.1 传统全文检索算法概述 | 第19-20页 |
2.1.2 正排索引和倒排索引 | 第20页 |
2.1.3 索引结构模型 | 第20-21页 |
2.2 面向大数据时索引结构存在的问题分析 | 第21-24页 |
2.2.1 数据结构扩展问题 | 第21-22页 |
2.2.2 增量索引问题 | 第22-23页 |
2.2.3 检索效率问题 | 第23-24页 |
2.3 面向大数据的分块式链表索引结构构建 | 第24-27页 |
2.3.1 基于倒排索引结构的改进思路 | 第24-25页 |
2.3.2 构建分块式链表索引结构模型 | 第25-26页 |
2.3.3 分块式链表索引结构模型描述 | 第26-27页 |
2.4 基于分块式链表索引结构的全文检索算法(BLIS)设计 | 第27-31页 |
2.4.1 正排索引算法设计 | 第27-28页 |
2.4.2 倒排索引算法设计 | 第28-29页 |
2.4.3 增量索引算法设计 | 第29-30页 |
2.4.4 索引检索算法设计 | 第30-31页 |
2.5 BLIS算法分析 | 第31-33页 |
2.5.1 数据结构扩展问题的解决 | 第31-32页 |
2.5.2 增量索引问题的解决 | 第32页 |
2.5.3 检索效率问题的解决 | 第32-33页 |
2.6 本章小结 | 第33-34页 |
第三章 分布式大数据全文检索算法D_BLIS | 第34-46页 |
3.1 分布式计算框架Storm介绍 | 第34-36页 |
3.1.1 分布式计算框架综述 | 第34页 |
3.1.2 Storm分布式计算框架介绍 | 第34-36页 |
3.1.3 Storm流数据序列模型介绍 | 第36页 |
3.2 分布式框架下全文检索算法存在的问题分析 | 第36-37页 |
3.2.1 传统全文检索算法的问题分析 | 第36-37页 |
3.2.2 分布式框架下全文检索算法的问题分析 | 第37页 |
3.3 D_BLIS算法的Topology流数据序列的构建 | 第37-42页 |
3.3.1 Storm分布式框架下BLIS算法的改进思路 | 第37-38页 |
3.3.2 索引创建阶段的Topology流数据序列设计 | 第38-40页 |
3.3.3 索引更新阶段的Topology流数据序列设计 | 第40-41页 |
3.3.4 检索阶段的Topology流数据序列设计 | 第41-42页 |
3.4 基于Storm流数据序列的D_BLIS算法的实现 | 第42-45页 |
3.4.1 索引创建阶段算法实现 | 第42-43页 |
3.4.2 索引更新阶段算法实现 | 第43-44页 |
3.4.3 检索阶段算法实现 | 第44-45页 |
3.5 本章小结 | 第45-46页 |
第四章 测试与分析 | 第46-62页 |
4.1 测试环境 | 第46-52页 |
4.1.1 测试环境组成 | 第46-50页 |
4.1.2 Storm集群配置 | 第50-51页 |
4.1.3 测试数据 | 第51-52页 |
4.2 BLIS算法测试与分析 | 第52-56页 |
4.2.1 测试思路 | 第52-53页 |
4.2.2 索引创建的测试及分析 | 第53-55页 |
4.2.3 索引检索测试及分析 | 第55-56页 |
4.3 D_BLIS算法的测试与分析 | 第56-61页 |
4.3.1 测试思路 | 第56-58页 |
4.3.2 索引创建的测试及分析 | 第58-60页 |
4.3.3 索引检索测试及分析 | 第60-61页 |
4.4 本章小结 | 第61-62页 |
第五章 工作总结与展望 | 第62-64页 |
5.1 工作总结 | 第62-63页 |
5.2 展望 | 第63-64页 |
参考文献 | 第64-67页 |
发表论文和科研情况说明 | 第67-68页 |
致谢 | 第68页 |