基于Lucene的全文信息检索技术的研究与应用

摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-10页
·研究背景	第7页
·研究现状	第7-9页
·全文信息检索技术现状	第7-8页
·中文分词技术现状	第8-9页
·论文主要工作及组织结构	第9-10页
·论文主要工作	第9页
·论文组织结构	第9-10页
第二章 Lucene技术分析	第10-21页
·Lucene 简介	第10页
·Lucene 框架结构分析	第10-12页
·Lucene 框架结构	第10-11页
·Lucene 包组织结构	第11-12页
·Lucene 索引技术分析	第12-16页
·Lucene 索引文件结构	第12-13页
·Lucene 索引文件格式	第13-15页
·Lucene 索引建立过程	第15-16页
·Lucene 索引文件存储	第16页
·Lucene 搜索技术分析	第16页
·Lucene 评分机制分析	第16-19页
·Lucene 评分公式	第17页
·Lucene 评分公式推导	第17-19页
·Lucene 评分排序特点	第19页
·Lucene 分词器分析	第19-20页
·Lucene 分词器的组成	第19页
·常用中文分词器分析	第19-20页
·本章小结	第20-21页
第三章网页采集和提取技术的分析与改进	第21-33页
·网络爬虫	第21-22页
·工作原理	第21页
·组成部分	第21-22页
·工作流程	第22页
·网络爬虫Heritrix 分析	第22-29页
·Heritrix 框架结构分析	第23-24页
·Crawl Controller 中央控制器	第24-25页
·在MyEclipse 环境下配置Heritrix	第25-26页
·对Heritrix 的改进工作	第26-29页
·网页解析工具分析	第29-32页
·HTML 网页结构	第29-30页
·HTML Parser 分析	第30-32页
·本章小结	第32-33页
第四章中文分词算法改进和设计	第33-48页
·中文分词算法分析	第33-35页
·四种中文分词算法简介	第33-35页
·四种中文分词算法比较	第35页
·三级索引词典结构设计与分词算法的改进	第35-42页
·经典词典结构	第35-37页
·三级索引词典结构	第37-38页
·词典结构的存储	第38页
·查找词典词条算法	第38-39页
·分词算法的改进	第39-40页
·分词算法时间复杂度和实验比较分析	第40-42页
·中文分词器的实现	第42-47页
·分词器的实现	第42-44页
·实验比较分析	第44-47页
·本章小结	第47-48页
第五章基于Lucene全文信息检索系统设计与实现	第48-57页
·开发运行环境	第48页
·Struts 框架技术的应用	第48-49页
·系统总体架构	第49-50页
·系统主要功能实现	第50-55页
·网页抓取模块	第50-51页
·索引模块	第51-53页
·检索模块	第53-54页
·其他功能模块	第54-55页
·搜索引擎模型系统的运行演示	第55-56页
·本章小结	第56-57页
第六章总结与展望	第57-58页
·总结	第57页
·展望	第57-58页
致谢	第58-59页
参考文献	第59-62页
附录：作者在攻读硕士学位期间发表的论文	第62页