基于LUCENE的搜索引擎研究与实现
摘要 | 第1-4页 |
Abstract | 第4-7页 |
第1章 绪论 | 第7-9页 |
·课题背景 | 第7页 |
·搜索引擎的发展现状 | 第7-8页 |
·本文各章内容安排 | 第8-9页 |
第2章 搜索引擎概述 | 第9-27页 |
·搜索引擎定义 | 第9页 |
·搜索引擎的特点 | 第9-10页 |
·搜索引擎的分类 | 第10-13页 |
·基于网络机器人Robot的搜索引擎 | 第10-11页 |
·基于目录Directory的搜索引擎 | 第11-12页 |
·基于元Meta的搜索引擎 | 第12-13页 |
·搜索引擎基本工作原理 | 第13-19页 |
·网络机器人 | 第14-19页 |
·索引与搜索 | 第19页 |
·Web服务器 | 第19页 |
·搜索引擎的指标和术语 | 第19-20页 |
·主流搜索引擎介绍 | 第20-27页 |
·Google | 第20-24页 |
·国内外其它主流搜索引擎 | 第24-27页 |
第3章 Lucene分析与设计 | 第27-57页 |
·Lucene是什么 | 第27页 |
·Lucene的历史 | 第27-28页 |
·Lucene的应用、特点及优势 | 第28-29页 |
·Lucene系统结构分析 | 第29-33页 |
·系统结构组织 | 第29-31页 |
·数据流分析 | 第31-32页 |
·基于Lucene的应用开发 | 第32-33页 |
·Lucene索引文件格式分析 | 第33-40页 |
·Lucene索引文件格式 | 第33-37页 |
·一些公用的基础类 | 第37-38页 |
·存储抽象 | 第38-40页 |
·Lucene索引构建逻辑模块分析 | 第40-50页 |
·对象体系与UML图 | 第40-47页 |
·全文检索的实现机制 | 第47页 |
·Lucene的索引效率 | 第47-49页 |
·Lucene中文语言分析器的设计 | 第49-50页 |
·Lucene与Robot的结合 | 第50-52页 |
·Web服务器Tomcat | 第52-57页 |
·什么是Tomcat服务器 | 第52-53页 |
·用户接口设计 | 第53-54页 |
·服务端设计 | 第54-56页 |
·在Tomcat上部署项目 | 第56-57页 |
第4章 关键技术研究 | 第57-81页 |
·网络机器人Robot优化 | 第57-63页 |
·递增式Robot | 第57-59页 |
·页面变化模型 | 第59-62页 |
·模型应用 | 第62-63页 |
·网页排序算法 | 第63-74页 |
·PageRank提出 | 第63-64页 |
·PageRank基本原理 | 第64-74页 |
·中文分词 | 第74-81页 |
·中文分词概述 | 第74页 |
·常见的中文分词算法 | 第74-76页 |
·中文分词歧义的处理 | 第76-78页 |
·未登录词的识别 | 第78-81页 |
第5章 总结与展望 | 第81-83页 |
·总结 | 第81页 |
·未来工作展望 | 第81-83页 |
参考文献 | 第83-86页 |
致谢 | 第86-87页 |
作者在硕士期间发表的学术论文 | 第87页 |