基于Solr的企业搜索引擎的研究与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-13页
·研究背景和意义	第9页
·国内外研究现状	第9-11页
·主要研究内容	第11页
·本文组织结构	第11-13页
第二章搜索引擎简介	第13-24页
·搜索引擎的基本结构	第13-14页
·搜索引擎的分类	第14-15页
·搜索引擎评价指标	第15-17页
·搜索引擎核心技术介绍	第17-23页
·全文索引技术	第17-19页
·信息检索技术	第19-23页
·本章小结	第23-24页
第三章系统相关技术研究	第24-43页
·网络爬虫技术	第24-26页
·网络爬虫基本原理	第24-25页
·网络爬虫抓取策略	第25-26页
·信息抽取技术	第26-29页
·中文分词技术	第29-31页
·中文分词算法	第29-30页
·常用中文分词器	第30-31页
·搜索引擎页面排序算法	第31-33页
·PageRank 算法	第31-32页
·HITS 算法	第32-33页
·相关技术	第33-42页
·Heritrix 介绍	第33-35页
·HTMLParser 介绍	第35-37页
·Lucene 介绍	第37-41页
·Solr 介绍	第41-42页
·本章小结	第42-43页
第四章系统模块设计与实现	第43-72页
·系统总体需求分析和设计	第43-44页
·系统需求分析	第43-44页
·系统框架设计	第44页
·网络爬虫模块的设计实现	第44-53页
·网络爬虫模块设计	第45-46页
·Heritrix 的改进和扩展	第46-50页
·任务抓取完成	第50-53页
·信息抽取模块设计实现	第53-55页
·基类设计	第53-54页
·具体解析类设计	第54-55页
·网页解析实现	第55页
·数据库设计实现	第55-57页
·数据库结构	第55-56页
·数据库处理类	第56-57页
·索引模块设计实现	第57-62页
·Solr 的安装配置	第57-59页
·Solr 中加入中文分词	第59-61页
·Solr 实现索引	第61-62页
·检索模块设计实现	第62-65页
·使用 Solr 查询	第62-64页
·Solrj 实现检索	第64-65页
·用户模块设计实现	第65-66页
·用户接口设计	第65-66页
·服务器端设计	第66页
·系统测试	第66-71页
·系统功能测试	第66-69页
·系统性能测试	第69-71页
·本章小结	第71-72页
第五章总结与展望	第72-74页
·全文工作总结	第72页
·进一步展望	第72-74页
参考文献	第74-77页
致谢	第77-78页
攻读硕士学位期间的研究成果	第78页