基于Lucene的全文检索系统的研究与应用

致谢	第1-6页
摘要	第6-7页
ABSTRACT	第7-11页
1 引言	第11-15页
·研究背景及现状	第11-12页
·存在的问题	第12-13页
·研究内容	第13页
·论文结构	第13-15页
2 全文检索相关技术概述	第15-30页
·全文检索系统概述	第15-17页
·全文检索技术	第15页
·全文检索的基本原理	第15-16页
·全文检索系统的体系结构	第16-17页
·全文检索引擎工具包Lucene	第17-22页
·Lucene中各包的功能	第17-18页
·Lucene内部数据流分析	第18-19页
·Lucene检索与数据库检索	第19-20页
·Lucene全文检索的实现机制	第20-22页
·全文索引模型介绍	第22-30页
·位图(BitMap)	第22页
·署名文件(Signature Files)	第22-23页
·倒排表(Inverted List)	第23-25页
·Pat树和Pat数组	第25-26页
·关联后继树(IRST)	第26-28页
·各种索引模型的比较	第28-30页
3 中文分词技术的研究与改进	第30-44页
·中文分词技术	第30-32页
·中文分词算法介绍	第30-31页
·中文分词中的难点	第31-32页
·全文检索系统对分词的要求	第32-33页
·改进后的中文分词算法	第33-44页
·最大匹配算法	第33-35页
·基于互关联后继树的词表结构	第35-41页
·歧义词处理	第41-42页
·实验结果分析	第42-44页
4 页面排序算法研究及改进	第44-52页
·业界已有的排序算法	第44-49页
·Lucene中默认的排序算法	第44-45页
·主流的页面排序算法介绍	第45-49页
·页面排序算法的改进	第49-51页
·实验结果分析	第51-52页
5 基于Lucene的全文检索系统的设计与实现	第52-68页
·项目简介	第52页
·系统的开发环境及常用包	第52页
·系统设计	第52-68页
·信息抓取模块	第54-57页
·中文分词模块	第57-60页
·全文索引模块	第60-63页
·信息检索模块	第63-66页
·数据库处理模块	第66-68页
6 全文检索系统的运行情况	第68-72页
·用户接口设计	第68-70页
·客户端设计	第68-69页
·服务器端设计	第69-70页
·系统的性能评价	第70-72页
7 总结与展望	第72-74页
·论文取得的成果	第72页
·进一步的工作	第72-74页
参考文献	第74-76页
作者简历	第76-78页
学位论文数据集	第78页