一种基于Lucene的文档检索系统的研究及应用
摘要 | 第1-6页 |
Abstract | 第6-9页 |
绪论 | 第9-13页 |
一、课题研究背景 | 第9-10页 |
二、国内外研究现状 | 第10-12页 |
三、论文的研究意义及主要内容 | 第12-13页 |
第一章 信息检索概述 | 第13-18页 |
·信息检索技术 | 第13-15页 |
·信息检索的概念 | 第13-14页 |
·信息检索模型 | 第14-15页 |
·搜索引擎简介 | 第15-16页 |
·搜索引擎的发展历史 | 第15页 |
·搜索引擎的分类 | 第15-16页 |
·信息检索过程 | 第16页 |
·全文检索概述 | 第16-17页 |
本章小结 | 第17-18页 |
第二章 全文检索相关技术研究 | 第18-24页 |
·文本相关技术 | 第18-20页 |
·文本分类 | 第18页 |
·文本标记语言 | 第18-19页 |
·文本预处理 | 第19页 |
·文本聚类 | 第19-20页 |
·索引模型介绍 | 第20-22页 |
·倒排文件 | 第20页 |
·后缀树和后缀数组 | 第20-21页 |
·签名档 | 第21-22页 |
·各种索引模型的比较 | 第22页 |
·中文分词技术简介 | 第22-23页 |
本章小结 | 第23-24页 |
第三章 页面排序算法及其改进 | 第24-34页 |
·信息检索的性能评价 | 第24-26页 |
·查全率和查准率 | 第24-25页 |
·其他评价方法 | 第25-26页 |
·主流页面排序算法介绍 | 第26-30页 |
·词频位置加权排序算法 | 第26-27页 |
·HITS算法 | 第27-28页 |
·PageRank算法 | 第28-30页 |
·PageRank算法的改进 | 第30-33页 |
·传统PageRank算法存在的问题 | 第30页 |
·改进的二次加权PageRank算法DPR | 第30-31页 |
·DPR算法的实验过程及结果分析 | 第31-33页 |
本章小结 | 第33-34页 |
第四章 全文检索引擎Lucene | 第34-47页 |
·Lucene简介 | 第34-35页 |
·Lucene的组成与结构 | 第35-37页 |
·系统组织结构 | 第35-36页 |
·Lucene的数据流分析 | 第36-37页 |
·Lucene中的索引与检索 | 第37-43页 |
·索引技术 | 第37-39页 |
·搜索技术 | 第39-41页 |
·多索引搜索的实现及线程池技术的改进 | 第41-43页 |
·Lucene的排序算法改进 | 第43-46页 |
·具体改进过程 | 第43-44页 |
·实验结果及分析 | 第44-46页 |
本章小结 | 第46-47页 |
第五章 服务外包政策文档搜索系统 | 第47-53页 |
·项目简介 | 第47页 |
·系统设计 | 第47-48页 |
·系统实现过程及关键技术解决 | 第48-52页 |
·软件开发相关技术 | 第48-49页 |
·文档录入模块的实现 | 第49-50页 |
·全文索引的实现 | 第50页 |
·数据检索模块的实现 | 第50-52页 |
本章小结 | 第52-53页 |
结论 | 第53-54页 |
参考文献 | 第54-57页 |
攻读硕士学位期间发表的学术论文 | 第57-58页 |
致谢 | 第58页 |