基于全文检索的企业资源搜索系统
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 绪论 | 第9-15页 |
| ·计算机信息检索的发展 | 第9-10页 |
| ·全文检索的定义 | 第10页 |
| ·检索技术的分类 | 第10-11页 |
| ·基于概念的信息检索技术 | 第10页 |
| ·超文本信息检索技术 | 第10-11页 |
| ·基于内容的多媒体检索技术 | 第11页 |
| ·数据挖掘技术的发展 | 第11-12页 |
| ·全文检索的特点 | 第12-13页 |
| ·全文检索面临的问题 | 第13-14页 |
| ·全文结构 | 第14-15页 |
| 第二章 倒排文件及压缩 | 第15-26页 |
| ·索引建立的目的 | 第15-16页 |
| ·单词的预处理 | 第16-17页 |
| ·倒排文件索引 | 第17-19页 |
| ·倒排文件索引的定义 | 第17页 |
| ·倒排索引的结构 | 第17-19页 |
| ·压缩倒排文件 | 第19-26页 |
| ·压缩方案 | 第20-23页 |
| ·局部贝努力模型 | 第23-24页 |
| ·索引压缩的效果 | 第24-26页 |
| 第三章 索引的查询 | 第26-41页 |
| ·布尔查询的定义 | 第26-27页 |
| ·排名查询的定义 | 第27-28页 |
| ·访问字典的方法 | 第28页 |
| ·最小完美哈希函数 | 第28-36页 |
| ·找到最小完美哈希函数的代价 | 第31-32页 |
| ·小完美哈希函数的设计 | 第32-36页 |
| ·信息检索和排名 | 第36-39页 |
| ·检索效果的评估 | 第39-41页 |
| ·空间消耗 | 第39页 |
| ·时间消耗 | 第39-41页 |
| 第四章 索引的创建 | 第41-54页 |
| ·频率矩阵转化倒排矩阵 | 第41-43页 |
| ·基于内存的倒排 | 第43-45页 |
| ·算法实现 | 第43-44页 |
| ·算法分析 | 第44-45页 |
| ·基于排序的倒排 | 第45-50页 |
| ·算法实现 | 第46-49页 |
| ·算法分析 | 第49-50页 |
| ·对大规模文档集合的支持 | 第50-54页 |
| ·使用压缩实现大规模文档的倒排 | 第50-53页 |
| ·使用多路归并算法改进系统 | 第53-54页 |
| 第五章 系统的实现 | 第54-66页 |
| ·需求分析 | 第54-57页 |
| ·各模块详细设计 | 第57-62页 |
| ·系统截图 | 第62-63页 |
| ·主要模块单元测试 | 第63-66页 |
| 第六章 全文总结和展望 | 第66-67页 |
| 参考文献 | 第67-68页 |