首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Nutch的搜索系统的研究

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-16页
   ·搜索引擎简介第8-11页
     ·什么是搜索引擎第8页
     ·搜索引擎的发展历史第8-9页
     ·搜索引擎的分类第9-10页
     ·当前主流搜索引擎简介第10-11页
   ·搜索引擎研究现状第11-12页
   ·搜索引擎的发展趋势第12-14页
   ·本文研究的主要工作第14-15页
   ·论文的结构第15-16页
第二章 搜索引擎的综合研究第16-34页
   ·搜索引擎与传统信息检索第16-17页
   ·搜索引擎的体系结构第17-23页
     ·网页采集模块(搜索器Crawler)第18-21页
     ·索引模块(Indexer)第21-23页
       ·建立索引的过程第21-23页
     ·检索模块(Searcher)第23页
   ·实际系统研究第23-33页
     ·Google的整体结构第23-24页
     ·Google的工作过程第24-25页
     ·Google中的主要数据结构第25-30页
     ·Google主要技术分析第30-33页
   ·本章小结第33-34页
第三章 中文分词技术和页面优先度算法第34-50页
   ·搜索引擎的性能指标第34页
   ·中文分词技术第34-43页
     ·什么是中文分词技术第34-35页
     ·中文分词技术第35-43页
   ·页面优先度算法研究第43-49页
     ·页面优先度算法基础第43-45页
     ·页面优先度算法第45-49页
   ·本章小结第49-50页
第四章 NUTCH搜索引擎介绍第50-56页
   ·Nutch搜索引擎简介第50页
   ·Nutch的基本结构第50-53页
   ·Lucene索引结构第53-55页
     ·Lucene索引文件逻辑结构第53页
     ·Lucene中的关键索引文件第53-55页
   ·本章小结第55-56页
第五章 中科慧创有限公司补丁网站的搜索系统第56-84页
   ·开发平台搭建第56页
   ·开发软件的安装和配置第56-61页
   ·在Nutch中增加中文分词模块第61-73页
     ·Nutch原有的对中文的支持第62页
     ·Nutch的Analysis包分析第62-66页
     ·在Nutch中增加中文分词模块第66-73页
   ·改进Nutch的页面优先度算法第73-78页
     ·Nutch原有的叶面优先度算法第73-74页
     ·改进后的页面优先度算法第74页
     ·改进页面优先算法的软件实现第74-78页
   ·系统运行步骤第78-83页
     ·抓取页面前的准备工作第78页
     ·运行Crawl命令抓取网站页面第78-80页
     ·使用LUKE工具查看索引数据库第80页
     ·使用TOMCAT进行测试搜索第80-83页
   ·本章小结第83-84页
第六章 总结第84-85页
致谢第85-86页
参考文献第86-89页
在攻读期间取得的研究成果第89页

论文共89页,点击 下载论文
上一篇:混凝-UASB-SBR组合工艺处理化学浆糊清洗废水的试验研究
下一篇:采用构件化技术的电子商务系统设计与实现