基于Lucene全文索引系统设计与实现

摘要	第1-6页
Abstract	第6-7页
目录	第7-10页
图目录	第10-12页
表目录	第12-15页
第一章绪论	第15-18页
·背景	第15-16页
·设计方案	第16-17页
·本文的组织结构	第17-18页
第二章相关技术	第18-26页
·信息检索	第18页
·信息检索模型	第18-20页
·布尔模型	第19页
·向量模型	第19-20页
·开源的全文索引工具包Lucene	第20-24页
·Lucene的整体架构	第21-22页
·Lucene索引机制	第22-23页
·Lucene索引建立流程	第23-24页
·新词识别技术	第24-25页
·本章小结	第25-26页
第三章系统分析与设计	第26-47页
·系统用例分析	第26-27页
·系统总体设计	第27-28页
·文档预处理的设计	第28-30页
·Office文档文本提取的设计	第28-29页
·PDF文本提取的设计	第29页
·HTML文本提取的设计	第29-30页
·新词的识别的设计	第30-35页
·新词识别的分析	第30-33页
·新词识别详细设计	第33-35页
·索引模块的设计	第35-37页
·检索模块的设计	第37-40页
·检索模块分析	第37-39页
·检索模块详细设计	第39-40页
·拼音搜索的设计	第40-46页
·拼音搜索分析	第40-43页
·拼音搜索详细设计	第43-46页
·本章小结	第46-47页
第四章全文索引系统的实现	第47-60页
·文档预处理模块的实现	第47-50页
·HTMLProcessor的实现	第47-48页
·PDFProcessor的实现	第48-49页
·OFFICE文件文本提取的实现	第49-50页
·新词识别的实现	第50-55页
·汉字构词能力统计的实现	第50-52页
·2元候选词识别的实现	第52-53页
·高元候选词识别的实现	第53-55页
·索引模块的实现	第55-56页
·拼音搜索模块的实现	第56-57页
·检索模块的实现	第57-59页
·本章小结	第59-60页
第五章总结与展望	第60-62页
·本文的工作	第60页
·下一步的工作	第60-62页
参考文献	第62-64页
致谢	第64-65页
参与的项目	第65-67页