大数据的全文检索研究
摘要 | 第1-4页 |
Abstract | 第4-5页 |
目录 | 第5-7页 |
第1章 概述 | 第7-14页 |
·研究背景及意义 | 第7-9页 |
·国内外全文检索研究现状 | 第9-12页 |
·国外全文检索研究现状 | 第9-10页 |
·国内全文检索研究现状 | 第10-12页 |
·研究目标与内容 | 第12页 |
·研究目标 | 第12页 |
·研究内容 | 第12页 |
·拟解决的关键问题 | 第12-13页 |
·本文的组织结构安排 | 第13-14页 |
第2章 系统总体架构及关键技术介绍 | 第14-23页 |
·概念介绍 | 第14-15页 |
·系统总体架构设计 | 第15页 |
·系统关键技术介绍 | 第15-22页 |
·B+树技术 | 第15-18页 |
·线性散列技术 | 第18-22页 |
·本章小结 | 第22-23页 |
第3章 全文检索系统的设计与实现 | 第23-55页 |
·索引存储结构设计 | 第23-40页 |
·词典文件结构设计 | 第25页 |
·倒排表存储结构设计与实现 | 第25-30页 |
·索引文件磁盘 I/O 层设计与实现 | 第30-33页 |
·缓冲区管理机制 | 第33-38页 |
·堆文件管理器的设计与实现 | 第38-40页 |
·文档集合来源 | 第40-41页 |
·文档预处理 | 第41页 |
·正排索引构建 | 第41-42页 |
·倒排索引构建 | 第42-53页 |
·基于 B+树的倒排索引 | 第46-51页 |
·基于线性散列的倒排索引 | 第51-53页 |
·系统检索模型构建 | 第53-54页 |
·本章小结 | 第54-55页 |
第4章 系统测试与结果分析 | 第55-58页 |
·测试环境 | 第55页 |
·系统测试及结果分析 | 第55-57页 |
·带缓冲的模式下 87 万词条随机检索 | 第55-56页 |
·带缓冲模式下 87 万词条的插入删除效率 | 第56-57页 |
·两种存储模式下占用磁盘空间大小比较 | 第57页 |
·本章小结 | 第57-58页 |
第5章 总结与展望 | 第58-60页 |
·全文总结 | 第58页 |
·研究展望 | 第58-60页 |
参考文献 | 第60-63页 |
致谢 | 第63-64页 |
作者简历 | 第64页 |