首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Solr的搜索引擎核心技术研究与应用

摘要第1-5页
Abstract第5-10页
第1章 前言第10-15页
   ·搜索引擎第10页
   ·搜索引擎的背景及发展第10-13页
     ·搜索引擎发展的背景介绍第10-11页
     ·搜索引擎的发展历史第11-12页
     ·搜索引擎现状概述第12-13页
   ·研究目的及意义第13-14页
     ·开源搜索引擎发展现状第13页
     ·研究Solr的目的及意义第13-14页
   ·本文研究内容及组织结构第14-15页
第2章 搜索引擎及Solr第15-25页
   ·搜索引擎工作原理第15-16页
   ·搜索引擎划分第16-18页
     ·搜索引擎分类第16-17页
     ·垂直搜索第17页
     ·分面搜索第17-18页
   ·Solr-Lucene的关系第18页
   ·Lucene概要及架构分析第18-22页
   ·Solr介绍第22-25页
     ·Solr简介第22页
     ·Solr总体架构第22-23页
     ·Solr的优势及主要特性第23-25页
第3章 搜索引擎的核心技术研究第25-46页
   ·网络爬虫第25-29页
     ·网络爬虫流程第25-26页
     ·网络爬虫分类第26页
     ·网络爬虫评价标准第26-28页
     ·抓取策略第28-29页
   ·网页解析与HtmlParser第29-31页
     ·Htmlparser简述第30-31页
     ·Htmlparser解析网页方法第31页
   ·中文分词第31-34页
     ·常见中文分词算法第32-33页
     ·常见中文分词系统第33-34页
   ·索引的建立第34-40页
     ·搜索引擎索引原理第34-37页
     ·建立索引第37-40页
   ·相关排序第40-46页
     ·PageRank算法第41-42页
     ·HITS算法第42-44页
     ·Solr的排序第44-46页
第4章 总体设计及开发环境介绍第46-53页
   ·系统介绍第46页
   ·系统整体架构第46-48页
   ·数据库的设计及词典库第48-49页
     ·数据库的设计第48-49页
     ·词典库第49页
   ·开发环境及相关技术介绍第49-53页
     ·开发环境第49-50页
     ·技术介绍第50-53页
第5章 系统详细设计及实现第53-79页
   ·信息搜集模块的实现第53-59页
     ·Heritrix总体结构第53-55页
     ·Heritrix配置第55-57页
     ·Heritrix扩展第57-59页
     ·实验测试分析第59页
   ·网页解析系统的设计第59-62页
   ·索引模块实现第62-65页
     ·实现中文分词第62-63页
     ·配置并建立索引第63-65页
   ·搜索模块实现第65-68页
   ·自动补全第68-71页
   ·缓存设计第71-75页
     ·缓存使用第72-73页
     ·实验测试分析第73-75页
   ·Solr分布式研究第75-79页
     ·模拟实现集群第76-77页
     ·容错实验测试第77-79页
第6章 总结与展望第79-80页
致谢第80-81页
参考文献第81-84页
攻读硕士研究生期间参与的项目第84页

论文共84页,点击 下载论文
上一篇:学术会议网络化运行与管理系统设计与实现
下一篇:基于J2EE架构的网络资源管理中间件设计与实现