基于全文检索的企业资源搜索系统
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-15页 |
·计算机信息检索的发展 | 第9-10页 |
·全文检索的定义 | 第10页 |
·检索技术的分类 | 第10-11页 |
·基于概念的信息检索技术 | 第10页 |
·超文本信息检索技术 | 第10-11页 |
·基于内容的多媒体检索技术 | 第11页 |
·数据挖掘技术的发展 | 第11-12页 |
·全文检索的特点 | 第12-13页 |
·全文检索面临的问题 | 第13-14页 |
·全文结构 | 第14-15页 |
第二章 倒排文件及压缩 | 第15-26页 |
·索引建立的目的 | 第15-16页 |
·单词的预处理 | 第16-17页 |
·倒排文件索引 | 第17-19页 |
·倒排文件索引的定义 | 第17页 |
·倒排索引的结构 | 第17-19页 |
·压缩倒排文件 | 第19-26页 |
·压缩方案 | 第20-23页 |
·局部贝努力模型 | 第23-24页 |
·索引压缩的效果 | 第24-26页 |
第三章 索引的查询 | 第26-41页 |
·布尔查询的定义 | 第26-27页 |
·排名查询的定义 | 第27-28页 |
·访问字典的方法 | 第28页 |
·最小完美哈希函数 | 第28-36页 |
·找到最小完美哈希函数的代价 | 第31-32页 |
·小完美哈希函数的设计 | 第32-36页 |
·信息检索和排名 | 第36-39页 |
·检索效果的评估 | 第39-41页 |
·空间消耗 | 第39页 |
·时间消耗 | 第39-41页 |
第四章 索引的创建 | 第41-54页 |
·频率矩阵转化倒排矩阵 | 第41-43页 |
·基于内存的倒排 | 第43-45页 |
·算法实现 | 第43-44页 |
·算法分析 | 第44-45页 |
·基于排序的倒排 | 第45-50页 |
·算法实现 | 第46-49页 |
·算法分析 | 第49-50页 |
·对大规模文档集合的支持 | 第50-54页 |
·使用压缩实现大规模文档的倒排 | 第50-53页 |
·使用多路归并算法改进系统 | 第53-54页 |
第五章 系统的实现 | 第54-66页 |
·需求分析 | 第54-57页 |
·各模块详细设计 | 第57-62页 |
·系统截图 | 第62-63页 |
·主要模块单元测试 | 第63-66页 |
第六章 全文总结和展望 | 第66-67页 |
参考文献 | 第67-68页 |