摘要 | 第1-5页 |
Abstract | 第5-8页 |
1 绪论 | 第8-12页 |
·课题背景及需求 | 第8页 |
·全文检索的概念 | 第8-9页 |
·全文检索引擎工具包LUCENE 简介 | 第9-10页 |
·LUCENE 的优点 | 第10页 |
·LUCENE 的特点 | 第10-11页 |
·本论文的结构以及主要工作 | 第11-12页 |
2 LUCENE 与关系型数据库的对比 | 第12-16页 |
·LUCENE 与关系型数据库概述 | 第12页 |
·LUCENE 与传统关系型数据库的联系 | 第12页 |
·两者在全文检索问题上的对比 | 第12-13页 |
·LUCENE 与数据库索引的对比 | 第13-14页 |
·LUCENE 与数据库模糊查询的对比 | 第14-16页 |
3 LUCENE 系统结构分析 | 第16-22页 |
·LUCENE 系统结构组织 | 第16-17页 |
·LUCENE 数据流分析 | 第17-18页 |
·对LUCENE 分析中学习到的先进理念 | 第18-19页 |
·基于LUCENE 的应用开发 | 第19-22页 |
4 网络爬虫模块的设计 | 第22-44页 |
·基于LUCENE 的英文PDF 文档全文检索系统框架 | 第22页 |
·网络爬虫模块的设计 | 第22-44页 |
·Config | 第24-25页 |
·Main | 第25-26页 |
·SerialGen | 第26-27页 |
·ProxyUsers | 第27-29页 |
·LinkManager | 第29-31页 |
·Downloader | 第31-32页 |
·Crawler | 第32-35页 |
·run( )方法 | 第35-42页 |
·processPDF( )方法 | 第42-44页 |
5 文档分析模块的设计 | 第44-56页 |
·文档分析模块的设计目的 | 第44页 |
·文档分析模块中几个主要类的设计说明 | 第44-56页 |
·Indexer | 第44-47页 |
·PDFAnalyzer | 第47-50页 |
·PDFExtractor | 第50-52页 |
·getKeyWordText(String, int)方法 | 第52-53页 |
·SimpleTextAnalyzer | 第53-56页 |
6 用户查询模块的设计 | 第56-66页 |
·用户界面的设计 | 第56-57页 |
·用户界面模块的设计目标 | 第56页 |
·用户界面模块的设计实施 | 第56-57页 |
·用户界面模块中主要类的设计说明 | 第57-66页 |
·Main | 第57页 |
·Config 类 | 第57页 |
·Searcher | 第57-60页 |
·Result | 第60-63页 |
·ImCache | 第63-66页 |
7 运行评估以及未来展望 | 第66-68页 |
·运行评估 | 第66页 |
·安装方式 | 第66-67页 |
·未来的改进方向 | 第67页 |
·论文结论 | 第67-68页 |
致谢 | 第68-69页 |
作者攻读硕士期间的研究成果 | 第69页 |
作者攻读硕士期间参与的研究项目 | 第69-70页 |
参考文献 | 第70-71页 |