首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的全文检索系统模型的研究

摘要第1-5页
Abstract第5-6页
目录第6-10页
图表目录第10-12页
第一章 绪论第12-17页
   ·研究背景第12页
   ·全文检索技术及其意义第12-13页
   ·全文检索技术的研究和应用现状第13-15页
     ·中文分词技术的现状第13-14页
     ·各种常见格式文档处理技术的现状第14-15页
   ·本文的研究内容及其意义第15-16页
   ·本文的组织结构第16-17页
第二章 基于Lucene的全文检索系统的理论基础第17-31页
   ·全文检索系统第17-20页
     ·全文检索系统的基本原理、功能和结构第17页
     ·全文检索系统的特点第17-18页
     ·全文检索系统的核心与实现机制第18-19页
     ·全文检索系统的技术评价标准第19-20页
   ·倒排索引技术第20-22页
     ·索引技术概述第20-21页
     ·倒排索引技术的基本原理第21-22页
   ·中文分词技术第22-25页
     ·中文分词问题的原因第22-23页
     ·中文分词技术研究的现状第23-25页
   ·全文检索引擎工具包Lucene第25-31页
     ·Lucene简介第25-26页
     ·Lucene的发展和现状第26页
     ·Lucene的源代码结构第26-27页
     ·Lucene的系统结构第27-30页
     ·Lucene的特点第30-31页
第三章 基于Lucene的全文检索系统的设计第31-42页
   ·系统目标第31页
   ·需求分析第31-32页
     ·系统的功能需求第31-32页
     ·系统的性能需求第32页
   ·系统总体设计第32-34页
   ·系统详细设计第34-42页
     ·中文分词第34-36页
     ·多种格式文档统一处理框架第36-38页
     ·索引纯文本文档第38页
     ·索引XML文档第38-39页
     ·索引HTML文档第39-40页
     ·索引PDF文档第40页
     ·索引Microsoft Word文档第40页
     ·索引RTF文档第40-42页
第四章 基于Lucene的全文检索系统的实现第42-50页
   ·平台及开发环境第42页
   ·中文分词功能的实现第42-44页
     ·CustomTokenizer第42-43页
     ·Spliter第43页
     ·Word第43-44页
   ·多种格式文档统一处理框架的实现第44-46页
     ·DocumentHandler第44页
     ·FileHandler第44页
     ·ExtensionFileHandler第44-45页
     ·DocumentHandlerException第45页
     ·FileHandlerException第45页
     ·FileIndexer第45-46页
   ·索引纯文本文档功能的实现第46-47页
     ·TextHandler第46-47页
   ·索引XML文档功能的实现第47页
     ·XMLHandler第47页
   ·索引HTML文档功能的实现第47-48页
     ·HTMLHandler第47-48页
   ·索引PDF文档功能的实现第48-49页
     ·PDFHandler第48-49页
   ·索引Microsoft Word文档功能的实现第49页
     ·WordHandler第49页
   ·索引RTF文档功能的实现第49-50页
     ·RTFHandler第49-50页
第五章 基于Lucene的全文检索系统的性能评测第50-56页
   ·实验环境构建第50页
   ·中文分词模块测试第50-53页
     ·评测依据和实验方法第50页
     ·测试数据的选取第50-51页
     ·实验过程概述第51-52页
     ·实验结果评述第52-53页
   ·多种格式文档统一处理框架的测试第53-56页
     ·评测依据和实验方法第53页
     ·测试数据的选取第53-54页
     ·实验结果评述第54-56页
第六章 基于Lucene的全文检索系统的关键点探讨第56-64页
   ·中文分词的关键点第56-58页
     ·正向最大匹配算法中长词屏蔽短词的问题第56-57页
     ·未登录词的识别与处理问题第57-58页
   ·检索结果处理的关键点第58-60页
     ·检索结果定制排序对性能造成的影响第58-59页
     ·检索结果的分类组织第59页
     ·检索结果优化处理对缓存的要求第59-60页
   ·查询接口实现的关键点第60-62页
     ·相关关键字的索引问题第60-61页
     ·查询器的构建方式第61-62页
   ·索引的更新策略第62-64页
     ·索引更新的一种改进思路第62-64页
第七章 结束语第64-66页
参考文献第66-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:SBBR工艺高效硝化及污泥减量研究
下一篇:我国房地产投资信托(REITs)发展策略研究